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(54) Title: QUALITATIVE DIFFERENTIAL SCREENING 
(54) Titre: CRIBLAGE DIFFERENTIEL QUALITATIF 
(57) Abstract 

The invention concerns a method for identifying and/or cloning nucleic acid regions representing qualitative differences associated 
with alternative splicing events and/or with insertions, deletions located in RNA transcribed genome regions, between two physiological 
situations, comprising either hybridisation of RNA derived from the test situation with cDNA's derived from the reference situation and/or 
reciprocally, or double-strand hybridisation of cDNA derived from the test situation with cDNA's derived from the reference situation; and 
identifying and/or cloning nucleic acids representing qualitative differences. The invention also concerns compositions or banks of nucleic 
acids representing qualitative differences between two physiological situations, obtainable by the above method, and their use as probe, 
for identifying genes or molecules of interest/or stilt for example in methods of pharmacogenomics, and profiling of molecules relative to 
their therapeutic and/or toxic effects. The invention further concerns the use of dysregulation of splicing RNA as markers for predicting 
molecule toxicity and/or efficacy, and as markers in pharmacogenomics. 

(57) Abreg£ 

L'invention conceme un proc€d6 d'identification et/ou de clonage de regions decides nucl6iques representatives de differences 
qualitatives associees a des 6v6nements d'epissages alternatifs et/ou a des insertions, d616tions se trouvant dans des r6gions du genome 
transcrites en ARN, entre deux situations physiologiques, comprenant soit Thybridation d'ARN provenant de la situation test avec les 
ADNc provenant de la situation de reference et/ou reciproquement, soit l'hybridation d'ADNc double-brin provenant de la situation test 
avec les ADNc provenant de la situation de reference et 1' identification et/ou le clonage d'acides nuc!6iques representatifs des differences 
qualitatives. L'invention conceme 6galement des compositions ou banques d'acides nucldiques repr6sentatifs de differences qualitatives 
entre deux situations physiologiques, susceptibles d'etre obtenues par le proc&te decrit ci-dessus, ainsi que leur utilisation comme sonde, 
pour F identification de genes ou molecules d'int6ret, ou encore par exemple dans des m6thodes de pharmacogenomique, et de profilage de 
molecules vis a vis de leurs effets therapeutiques et/ou toxiques. L'invention conceme aussi Tutilisation des dysregulations de Tdpissage des 
ARN comme marqueurs de prediction de la toxicit6 et/ou de l'efficacite" de molecules, ainsi que comme marqueurs de pharmacogenomique 
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CRIBLAGE DlFFEzRENTlEL QUALITAT1F 
Cette invention se rapporte aux domaines techniques de la 
biotechnologie, de la medecine, dela biologie et de la biochimie. Ses 
applications concernent les domaines de la sante humaine, animate et 

5 vegetate. Plus particulierement, T invention permet d' identifier des sequences 
d'acides nucleiques permettant de concevoir de nouveaux cribles pour 
molecules d'interet therapeutique, de nouveaux outils de therapie genique 
ainsi que d'apporter des indications sur le potentiel toxique et le suivi 
d'efficacite de molecules et des informations de pharmacogenomique. 

io La presente invention decrit notamment une serie de 

techniques originates d' identification de sequences d'acides nucleiques 
basee sur la mise en evidence des differences qualitatives entre les ARN 
issus de deux contextes differents que Ton desire comparer, en particulier 
issus d'un tissu ou d'un organe malade et leur equivalent sain. Plus 

15 precisement, ces techniques sont destinees a doner specifiquement les 
introns et les exons alternatifs episses differentiellement entre une situation 
pathologique et un etat sain ou entre deux situations physiologiques que Ton 
desire comparer. Ces differences qualitatives au sein des ARNs peuvent 
egalement provenir d'alteration(s) du genome, de type insertions ou 

20 deletions dans des regions qui seront transcrites en ARN. Cette serie de 
techniques est identifi6e par I'acronyme DATAS : Differential Analysis of 
Transcripts with Alternative Splicing. 

La caracterisation des alterations de Texpression genetique qui 
president ou s6nt associees a une pathologie donnee suscite un espoir 

25 important de d6couvrir de nouvelles cibles therapeutiques et de nouveaux 
outils diagnostiques. Toutefois, I' identification d'une sequence d'ADN 
genomique ou complementaire, qu f elle ait lieu par clonage positionnel ou par 
des techniques de criblage differentiel quantitatif, n'apporte que peu ou pas 
d'information sur la fonction et encore moins sur les domaines fonctionnels 

30 mis en jeu dans les deregulations liees a la pathologie etudiee. La presente 
invention decrit une serie de techniques originates qui visent a identifier les 
differences d'epissages des ARNs qui existent entre deux situations 
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physiopathologiques distinctes. L'identification de ces differences apporte 
des informations sur les differences qualitatives et non sur les differences 
quantitatives comme c'est le cas pour les techniques decrites jusqu'a 
present. L'ensemble des techniques presentees dans la presente invention 
5 sont done regroupees sous Tappellation "criblage differentiel qualitatif ou 
DATAS. Les methodes de I'invention sont utilisables pour ['identification de 
nouvelles cibles ou produits therapeutiques, pour la preparation d'outils de 
recherche genetique et/ou d'outils de diagnostic, pour la construction de 
banques decides nucleiques, et dans des methodes de determination du 

10 profit toxicologique ou de I'efficacite d'un compose par exemple. 

Un premier objet de ('invention reside plus particulierement 
dans un procede d'identification et/ou de clonage de regions d'acides 
nucleiques representatives de differences genetiques qualitatives entre deux 
echantillons biologiques, comprenant une etape d'hybridation d'une 

15 population d'ARN ou d'ADNc double-brin provenant d'un premier echantillon 
biologique avec une population d'ADNc provenant d f un deuxieme echantillon 
biologique (Figure 1A). 

Comme indique ci-avant, ies differences genetiques qualitatives 
peuvent etre dues a des modifications d'epissage des ARN ou a des 

20 deletions et/ou insertions dans des regions du genome qui sont transcrites 
en ARN. 

Dans un premier mode de realisation, il s'agit d f une hybridation 
entre une population d'ARN provenant d'un premier echantillon biologique et 
une population d'ADNc (simple-brin ou double-brin) provenant d'un deuxieme 

25 echantillon biologique. 

Dans un autre mode de realisation, il s'agit d'une hybridation 
entre une population d'ADNc double-brin provenant d'un premier echantillon 
biologique et une population d'ADNc (double-brin ou, preferentiellement 
simple-brin) provenant d'un deuxieme echantillon biologique. 

30 Un objet plus particulier de ['invention reside dans un procede 

d'identification de regions d'acides nucleiques epissees differentiellement 
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entre deux situations physiologiques, comprenant Phybridation d'une 
population d'ARN ou d'ADNc double-brin provenant d'une situation test avec 
une population d'ADNc provenant d'une situation de reference et 
Identification d'acides nucleiques correspondant a des epissages 
5 differentiels. 

Un autre objet de Pinvention concerne un precede de clonage 
d'acides nucleiques episses differentiellement entre deux situations 
physiologiques, comprenant Phybridation d'une population d'ARN ou d'ADNc 
double-brin provenant de la situation test avec une population d'ADNc 
10 provenant de la situation de reference et le clonage d'acides nucleiques 
correspondant a des epissages differentiels. 

Dans un mode particulier de mise en oeuvre, le procede 
d'identification et/ou de clonage d'acides nucleiques de Pinvention comprend 
deux hybridations paralleles : 
15 (a) Phybridation des ARN provenant du premier echantillon 

(situation test) avec les ADNc provenant du deuxieme echantillon (situation 
de reference); 

(b) Phybridation des ARN provenant du deuxieme echantillon 
(situation de reference) avec les ADNc provenant du premier echantillon 

20 (situation test); et 

(c) Pidentification et/ou le clonage, a partir des hybrides formes 
en (a) et (b) d'acides nucleiques correspondant a des differences genetiques 
qualitatives. 

La presente invention concerne egalement la preparation de 
25 banques d'acides nucleiques, les acides nucleiques et banques ainsi 
obtenus, ainsi que les utilisations de ces materiels dans tous les domaines 
de la biologie/biotechnologie, comme illustre plus loin. 

A cet egard, Pinvention est egalement relative a un procede de 
preparation de compositions ou banques d'acides nucleiques profilees, 
30 representatives des differences qualitatives existant entre deux echantillons 
bioiogiques, comprenant une etape d'hybridation d'une population d'ARN 



BNSDOCID: <WO 9946403A1 J_> 



WO 99/46403 



4 



PCT/FR99/00547 



provenant d'un premier echantillon biologique avec une population d'ADNc 
provenant d'un deuxieme echantillon biologique. 

L'invention concerne en outre une methode de profilage 
("profiling") d'une composition d'ADNc, comprenant une etape d'hybridation 
de cette composition avec une population d'ARN, ou inversement. 

Comme indique ci avant, la presente invention concerne en 
particulier des methodes d'identification et de clonage d'acides nucleiques 
representatifs d'un etat physiologique. En outre, les acides nucleiques 
identifies et/ou clones represented les qualites d f un etat physiologique en ce 
sens que ces acides nucleiques sont generalement en grande partie 
impliques dans I'etat physiologique observe. De ce fait, les methodes 
qualitatives de ('invention donnent acces directement aux elements 
genetiques ou a leur produit proteique, ayant un role fonctionnel dans le 
developpement d'un etat physiopathologique. 

Les methodes selon Pinvention reposent en partie sur une 
etape originale d'hybridation croisee entre des ARN et des ADNc de 
situations physiologiques differentes. Cette ou ces hybridations croisees 
permettent avantageusement de mettre en evidence, dans les hybrides 
formes, des regions non appariees, c'est-a-dire des regions presentes dans 
les ARNs dans une situation physiologique donnee et pas dans les ARNs 
dans une autre situation physiologique. Ces regions correspondent 
essentiellement a des epissages altematifs caracteristiques d'un etat 
physiologique, mais peuvent egalement refleter des alterations genetiques 
de type insertions ou deletions, et constituent ainsi des elements genetiques 
particulierement utiles sur le plan therapeutique ou diagnostic comme 
explique ci-apres. Uinvention consiste done notamment a conserver les 
complexes formes apres hybridation(s) croisee(s), afin d'en extraire les 
regions correspondant a des differences qualitatives. Cette methodologie se 
differencie des techniques de soustractions quantitatives connues de 
rhomme de I'art ( Sargent and Dawid (1983), Science, 222, 135-139 ; Davis 
et.al. (1984), PNAS, 81, 2194-2198 ; Duguid and Dinauer (1990) Nuc. Acid 
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Res., 18, 2789-2792; Diatchenko et.al. (1996) PNAS, 93, 6025-6030), qui 
apres hybridation(s), eliminent les hybrides formes pour ne conserver que les 
acides nucleiques non complexes. 

L'invention concerne done en premier lieu un procede 
5 d'identification d'acides nucleiques d'interet comprenant I'hybridation entre 
les ARN d'un echantillon test et les ADNc d'un echantillon de reference. 
Cette hybridation permet de mettre en evidence, au sein des complexes 
formes, des differences genetiques qualitatives entre les situations testees, 
et ainsi d'identifier et/ou de doner par exemple les epissages 

10 caracteristiques de la situation test. 

Selon une premiere variante de l'invention, le procede permet 
done de generer une population d'acides nucleiques caracteristiques des 
epissages de I'etat physiologique test par rapport a I'etat de reference (Figure 
1A, 1B). Comme indique ci-apres, cette population peut etre utilisee pour le 

is clonage et la caracterisation des acides nucleiques, leur utilisation en 
diagnostic, criblage, therapeutique ou pour la production d'anticorps ou de 
fragments proteiques ou de proteines entieres. Cette population peut 
egalernent servir a la constitution de banques utilisables dans differents 
domaines duplications illustres plus loin et a la realisation de sondes 

20 marquees (Figure 1D). 

Selon une autre variante de Pinvention, le procede comprend 
une premiere hybridation telle que decrite ci avant et une seconde 
hybridation, en parallele, entre les ARN provenant de la situation de 
reference et les ADNc provenant de la situation test. Cette variante est 

25 particulierement avantageuse puisqu'elle permet de generer deux 
populations decides nucleiques, I'une representant les qualites de la 
situation test par rapport a la situation de reference, et I'autre les qualites de 
la situation de reference par rapport a la situation test (Figure 1C). Ces deux 
populations peuvent egalernent etre utilisees comme source d'acides 

30 nucleiques, ainsi que comme banques temoignant de I'empreinte genetique 
d'une situation physiologique donnee, comme detaille plus loin (Figure 1D). 
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La presente invention peut etre appliquee a tous types 
d'echantillons biologiques. En particulier, Techantillon biologique peut etre 
toute cellule, organe, tissu, prelevement, biopsie, etc., contenant des acides 
5 nucleiques. S'agissant d'un organe, tissu ou biopsie, ils sont eventuellement 
mis en culture de maniere a permettre I'acces aux cellules qui les 
composent. II peut s'agir d'echantillons provenant de mammiferes (en 
particulier rhomme), de vegetaux, de bacteries ou de cellules eucaryotes 
inferieures (levures, cellules fongiques, etc.). Des exemples de materiels 

10 sont en particulier une biopsie de tumeur, une biopsie de plaques 
neurodegeneratives ou d'aires cerebrales presentant des atteintes 
neurodegeneratives, un echantillon de peau, un echantillon de cellules 
sanguines obtenues apres prise de sang, une biopsie colorectal, des 
biopsies issues de lavages pulmonaires, etc. Des exemples de cellules sont 

is notamment les cellules musculaires, hepatiques, fibroblastes, nerveuses, de . 
Tepiderme, du derme, des cellules sanguines comme les lymphocytes B, T, 
les mastocytes, les monocytes, les granulocytes, les macrophages. 

Comme indique ci avant, le criblage differentiel qualitatif selon 
la presente invention permet d'identifier des acides nucleiques 

20 caracteristiques d'une situation physiologique donnee (situation B) par 
rapport a une situation physiologique de reference (situation A), en vue de 
leur clonage ou autres utilisations. A titre illustratif, les situations 
physiologiques A et B etudiees peuvent etre les suivantes : 



Situation A 


Situation B 


echantillon sain 


echantillon pathologique 


echantillon sain 


echantillon apoptotique 


echantillon sain 


echantillon apres. infection virale 


echantillon sensible a X 


echantillon resistant a X 
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echantillon non traite 


echantillon traite (par exemple 
Dar comon^p tnYiniip\ 


echantillon non differencie 


echantillon ayant subi une 
differentiation celiulaire ou 
tissulaire 



Populations d'ARN 

Pour la mise en oeuvre de la presente invention, il est possible 
5 d'utiliser des ARN totaux ou les ARN messagers. Ces ARN peuvent etre 
prepares par toutes methodes classiques de biologie moleculaire, bien 
connues de I'homme du metier. Ces methodes comprennent generalement 
une lyse des cellules ou tissu ou echantillons et I'isolement des ARNs par 
des techniques d'extraction. II peut s'agir en particulier d'un traitement au 

10 moyen d'agents chaotropiques tels que le thiocyanate de guanidium (qui 
detruit les cellules et protege les ARN) suivi d'une extraction des ARN au 
moyen de solvants (phenol, chloroforme par exemple). De telles methodes 
sont bien connues de I'homme du metier (voir Maniatis et al., Chomczynski et 
al., Anal. Biochem. 162 (1987) 156). Ces methodes peuvent etre aisement 

is pratiquees en utilisant des kits disponibles dans le commerce tels que par 
exemple le kit US73750 (Amersham) ou le kit Rneasy (Quiagen) pour les 
ARN totaux. II n'est pas necessaire que les ARN utilises soient parfaitement 
purs, et notamment il n'est pas genant que des traces d'ADN genomique ou 
d'autres composants cellulaires (proteine, etc.) subsistent dans les 

20 preparations, des lors qu'ils n'affectent pas significativement la stabilite des 
ARNs et que les modes de preparation entre les differents echantillons a 
comparer soient les memes. En outre, de maniere facultative, il est possible 
d'utiliser non pas des preparations d'ARN totaux mais des preparations 
d'ARN messagers. Ceux-ci peuvent etre isoles, soit directement a partir de 

25 I'echantillon biologique soit a partir des ARN totaux, au moyen de sequences 
polyT, selon les methodes classiques. L'obtention d'ARN messagers peut a 
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cet egard etre realisee au moyen de kits commerciaux tels que par exemple 
le kit US72700 (Amersham) ou le kit utilisant des billes oligo-(dT) (Dynal). Un 
mode avantageux de preparation d'ARN consiste a extraire les ARN 
cytosoliques puis les ARN polyA+ cytosoliques. Des kits permettant ia 
5 preparation selective d'ARN cytosoliques non contamines avec des ARN 
premessagers porteurs d'exons et d'introns non episses sont disponibles 
dans le commerce. C'est le cas notamment des kits Rneasy commercialises 
par Qiagen (exemple de reference : 74103). Les ARN peuvent egalement 
etre obtenus directement a partir de banques ou autres echantillons prepares 

10 a I'avance et/ou accessibles dans des collections, conserves dans des 
conditions appropriees. 

Generalement, les preparations d'ARN utilisees comprennent 
avantageusement au moins 0,1 pg d'ARN, de preference au moins 0,5pg 
d'ARN. Les quantites peuvent varier selon les cellules et les methodes 

15 utilisees, sans modifier la mise en oeuvre de la presente invention. Pour 
obtenir des quantites d'ARN suffisantes (de preference 0,1 pg au moins), il 
est generalement recommande d'utiliser un echantillon biologique 
comprenant au moins 10 5 cellules. A cet egard, une biopsie classique 
comprend generalement entre 10 5 et 10 8 cellules, et une culture cellulaire sur 

20 boite de petri classique (diametre 6-10 cm) comporte de I'ordre de 10 6 
cellules, ce qui permet d'obtenir aisement des quantites d'ARN suffisantes. 

Les preparations d'ARN peuvent etre utilisees 
extemporanement ou etre conservees, de preference au froid, en solution ou 
congelees, pour des utilisations ulterieures. 

25 

Populations d'ADNc 

Les ADNc utilises dans le cadre de la presente invention 
peuvent etre obtenus par transcription inverse selon les techniques 
classiques de biologie moleculaire. On peut se referer notamment a Maniatis 
30 et al. La transcription inverse est generalement realisee en utilisant une 
enzyme, transcriptase inverse ("reverse transcriptase") et une amorce. 
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A cet egard, de nombreuses transcriptases inverses ont ete 
decrites dans la litterature et sont disponibles dans le commerce (Kit 
1483188, Boehringer). On peut citer a titre d'exemples les transcriptases 
inverses les plus souvent utilisees comme celles du virus aviaire AMV (Avian 
5 Myeloblastosis Virus) et du virus de leucemie murine MMLV (Moloney Murine 
Leukemia Virus). II convient egalement de citer certaines DNA polymerase 
thermostables douees d'activite transcriptase inverse telles celles isolees de 
Thermus flavus et de Thermus thermophilus HB-8 (commercialement 
disponibles; references Promega M1941 et M2101). Selon une variante 

10 avantageuse, on utilise pour la mise en oeuvre de la presente invention la 
transcriptase inverse d'AMV puisque cette enzyme, fonctionnant a 42°C 
(contrairement a celle de MMLV qui fonctionne a 37°C), destabilise certaines 
structures secondaires des ARN qui pourraient bloquer I'elongation, et 
permet ainsi la transcription inverse d'ARN de longueur importante, et permet 

15 devoir des preparations d'ADNc representant les ARN avec une grande 
fidelite et une grande efficacite. 

Selon une autre variante avantageuse de ('invention, on utilise une 
transcriptase inverse depourvue d'activite RNaseH. ^utilisation de ce type 
d'enzyme offre plusieurs avantages, et notamment celui d'augmenter le 

20 rendement de synthese des ADNc et de prevenir toute degradation des 
ARN, qui seront ensuite engages dans des heteroduplex avec les ADNc 
neosynthetises, permettant ainsi eventuellement de se passer de I'extraction 
phenolique de ceux ci. Les transcriptases inverses depourvues d'activite 
RNaseH peuvent etre preparees a partir de toute transcriptase inverse par 

25 deletion(s) et/ou mutagenese. En outre, de telles enzymes sont egalement 
disponibles dans le commerce (par exemple Life Technologies, reference 
18053-017). 

Les conditions de mise en oeuvre des transcriptases inverses 
(concentration et temperature) sont bien connues de fhomme du metier. En 
30 particulier, on utilise generalement de 10 a 30 Unites d'enzyme par reaction, 
en presence d'une concentration optimale en Mg 2+ de 10 mM. 
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La ou les amorces utilisees pour la transcription inverse 
peuvent etre de natures differentes. I! peut s'agir en particulier d'un 
oligonucleotide aleatoire ("random") comprenant de preference entre 4 et 10 
5 nucleotides, avantageusement un hexanucleotide. L'utilisation de ce type 
d'amorce aleatoire a ete decrite dans la litterature et permet d'initier la 
transcription inverse en differentes positions au hasard au sein des 
molecules d'ARN. Cette technique est surtout employee pour la transcription 
inverse d'ARN totaux (c'est-a-dire comprenant les ARNm, les ARNt et les 

io ARNr notamment). Dans le cas ou Ton souhaite realiser la transcription 
inverse des ARNm seulement, il est avantageux d'utiliser comme amorce un 
oligonucleotide oligo dT, qui permet d'initier la transcription inverse a partir 
des queues polyA specifiques des ARN messagers. [.'oligonucleotide oligo 
dT peut comprendre de 4 a 20-meres, avantageusement de 15-meres 

15 environ. L'emploi de ce type d'amorce cpnstitue un mode de realisation 
prefere de Invention. D'autre part, il peut etre avantageux d'utiliser pour la 
transcription inverse une amorce marquee. Ceci peut en effet permettre de 
reconnaitre et/ou de selectionner et/ou de trier ulterieurement les ARN des 
ADNc. Ceci peut egalement permettre d'isoler les heteroduplex ARN/ADN 

20 dont la formation represente une etape clef de Tinvention. Le marquage de 
Pamorce peut consister en tout systeme de type ligand-recepteur, c'est-a-dire 
permettant par affinite de separer les molecules portant Tamorce. II peut 
s'agir par exemple d'un marquage par la biotine, qui peut etre separe par tout 
support (bille, colonne, plaques, etc.) sur lequel est fixee la streptavidine. 

25 Tout autre systeme de marquage permettant cette separation sans affecter 
les proprietes d'amorce peut etre utilise de maniere equivalente. 

Dans les conditions habituelles de mise en oeuvre, cette 
transcription inverse genere des ADN complementaires (ADNc) simple-brins. 
Ceci constitue un premier mode avantageux de la presente invention. 

30 Dans une deuxieme variante de mise en oeuvre, la transcription 

inverse est realisee de maniere a preparer des ADNc double-brins. Pour ce 
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faire, apres transcription du premier brin d'ADNc, le deuxieme brin peut etre 
genere selon les techniques classiques de biologie moleculaire faisant 
intervenir des enzymes de modification de PADN comme I'ADN Ligase du 
phage T4, 1'ADN polymerase I et I'ADN polymerase du phage T4. 
5 Les preparations d'ADNc peuvent etre utilisees 

extemporanement ou etre conservees, de preference au froid, en solution ou 
congelees, pour des utilisations uiterieures. 

Hvbridations 

io Comme expiique ci-avant, les methodes selon I'invention 

reposent en partie sur une etape originale d'hybridation croisee entre les 
ARN et les ADNc provenant d'echantillons biologiques dans des situations 
physiologiques ou d'origines differentes. Dans un mode de realisation 
prefere, Phybridation selon I'invention est avantageusement realisee en 

is phase liquide. En outre, elle peut etre effectuee dans tout dispositif 
approprie, tel que par exemple des tubes (Eppendorff, par exemple), des 
plaques, ou tout autre support adapte et couramment utilise en Biologie 
Moleculaire. Uhybridation est avantageusement realisee dans des volumes 
compris entre 10 et 1000 pi, par exemple entre 10 et 500 pi. II est entendu 

20 que le dispositif utilise et les volumes utilises peuvent etre aisement adaptes 
par rhomme du metier. Les quantites d'acides nucleiques utilisees pour 
Thybridation sont egalement connues de rhomme du metier. En general, il 
est suffisant d'utiliser des microgrammes d'acides nucleiques, par exemple 
de I'ordre de 0,1 a 100 pg. 

25 Un element plus important dans la mise en oeuvre des 

hybridations reside dans les quantites respectives d'acides nucleiques 
utilisees. Ainsi, il est possible d'utiliser les acides nucleiques dans un rapport 
ADNc/ARN variant de 50 a 0,02 environ, de preference de 40 a 0,1. De 
maniere plus particulierement avantageuse, on prefere que le rapport 

30 ADNc/ARN soit proche ou superieur a 1. En effet, dans ces experiences, 
TARN constitue le compose test ("tester") et I'ADNc constitue le porteur 
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("driver"). De ce fait, dans le but d'ameliorer la specificite de la methode, il est 
preferable d'operer dans des conditions ou le "driver" se trouve en exces par 
rapport au "tester". En effet, dans ces conditions, I'effet de cooperativite entre 
les acides nucleiques joue et les appariements non-parfaits sont fortement 
5 defavorises. De ce fait, les seuls mesappariements qui apparaissent sont 
generalement dus a la presence de regions dans les ARN "tester" qui 
n'existent pas dans I'ADNc "driver et qui sont done specifiques. Pour 
favoriser la specificite du procede, Thybridation est done avantageusement 
realisee a un rapport ADNc/ARN compris entre 1 environ et 10 environ. II est 

10 bien entendu que ce rapport peut etre adapte par rhomme du metier selon 
les conditions du procede (quantites d'acides nucleiques disponibles, 
situations physioiogiques, but poursuivi, etc.). Les autres para metres de 
('hybridation (temps, temperature, force ionique) sont egalement adaptables 
par Thomme du metier. De maniere generale apres denaturation des "tester" 

15 et "driver" (par chauffage par exemple), I'hybridation est realisee pendant 
environ 2 a 24 heures, a une temperature de 37°C environ (eventuellement 
soumise a des sauts de temperature comme decrit plus loin), et dans des 
conditions standard de force ionique (pouvant varier de 0,1 a 5M NaCI par 
exemple). II est connu que la force ionique est un des facteurs determinant la 

20 stringence d'une hybridation, notamment dans le cas d'hybridation sur 
support solide. 

Selon un mode de mise en oeuvre particulier de invention, 
Thybridation est realisee en emulsion phenolique, par exemple seion la 
technique PERT ("Phenol Emulsion DNA Reassociation Technique) decrite 

25 par Kohne D.E. et al. (Biochemistry, Vol. 16, N° 24, pp 5329-5341, 1977). 
Avantageusement, on utilise dans le cadre de la presente invention 
Thybridation en emulsion phenolique maintenue par thermocycles (sauts de 
temperature de 37°C environ a 60/65°C environ) et non par agitation, selon 
la technique decrite par Miller et Riblet (NAR 23 (1995) 2339). Toute autre 

30 technique d'hybridation en phase liquide, notamment en emulsion, peut etre 
utilisee dans le cadre de la presente invention. Ainsi, dans un autre mode 
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particulierement avantageux, l'hybridation est realisee dans une solution 
contenant 80% de formamide, a une temperature de 40°c par exemple. 

L'hybridation peut egalement se faire avec Tun des partenaires 
immobilise sur un support. Avantageusement, c'est PADNc qui est 
5 immobilise. Cela peut etre realise en tirant profit du marquage dont peuvent 
faire Pobjet les ADNc (voir ci-dessus) notamment grace a des amorces 
biotinylees. Les groupements biotine sont mis en presence de billes 
magnetiques sur lesquelles sont fixees des molecules de streptavidine. Les 
ADNc peuvent ensuite etre maintenus grace a un aimant au contact d'un 

10 filtre ou d'un puits de plaque de microtitration. Les ARN sont ensuite, dans 
les conditions de force ionique requise, mis en presence des ADNc. Les ARN 
non apparies sont elimines par lavage. Les ARN hybrides ainsi que les ADNc 
sont recuperes par retrait du champ magnetique. 

Dans le cas ou I'ADNc est double-brin, les conditions 

15 d'hybridation utilisees sont essentiellement similaires a celles decrites ci- 
dessus, et adaptables par Phomme du metier. On prefere dans ce cas 
proceder a l'hybridation en presence de formamide et on expose les 
complexes a une gamme de temperatures allant par exemple de 60 a 40 °C, 
preferentiellement de 56 °C a 44 °C, afin de favoriser la formation de 

20 complexes de type R-Ioop. De plus, il est souhaitable d'ajouter, apres 
l'hybridation, un agent de stabilisation des triplex formes, une fois la 
formamide retiree du milieu, tels que le glyoxal par exemple (Kaback et.al. 
(1979) Nuc. Acid Res., 6, 2499-2517). 

Ces hybridations croisees selon ('invention generent ainsi des 

25 compositions comprenant des heteroduplex ou heterotriplex ADNc/ARN, 
representant les qualites de chacune des situations physiologiques testees. 
Comme indique ci-avant, dans chacune de ces compositions, des acides 
nucleiques correspondant essentiellement a des epissages alternatifs 
differentiels ou a d'autres alterations genetiques, specifiques de chaque 

30 situation physiologique, peuvent etre identifies et/ou clones. 

L'invention concerne done avantageusement un precede 
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(^identification et/ou de clonage de regions d'acides representatives de 
differences genetiques entre deux situations physiologiques, comprenant 
une etape d'hybridation entre les ARN provenant d'un echantillon biologique 
dans une premiere situation physiologique et les ADNc simple-brins 
5 provenant d'un echantillon biologique dans une deuxieme situation 
physiologique, et I'identification et/ou le clonage, a partir des hybrides ainsi 
formes, des regions d'ARN non-appariees. 

Cette premiere variante repose plus particulierement sur la 
formation d'heteroduplex entre les ARN et les ADNc simple-brin (voir Figures 

10 2-4). Cette variante est avantageusement mise en oeuvre en utilisant des 
ARN rnessagers ou des ADNc produits par transcription inverse des ARN 
messagers essentiellement, b'est-a-dire en presence d'une amorce oligo dT. 

Dans un mode particulier de mise en oeuvre, le procede 
d'identification et/ou de clonage d'acides nucleiques de I'invention 

is comprend : 

(a) ('hybridation d'ARN provenant de la situation test avec les 
ADNc simple-brin provenant de la situation de reference; 

(b) Thybridatiori d'ARN provenant de la situation de reference 
avec les ADNc simple-brin provenant de la situation test; et 

20 (c) I'identification et/ou le clonage, a partir des hybrides formes 

en (a) et (b), de regions d'ARN non-appariees. 

Dans une variante particuliere de mise en oeuvre, le procede 
de I'invention comprend les etapes suivantes : 

(a) I'obtention d'ARN a partir d'un echantillon biologique dans 
25 une situation physiologique A (rA); 

(b) I'obtention d'ARN a partir d'un meme echantillon biologique 
dans une situation physiologique B (rB); 

(c) la preparation d'ADNc a partir d'une partie des ARN rA 
obtenus en (a) (ADN cA) et a partir d'une partie des ARN rB obtenus en (b) 

30 (ADN cB) au moyen d'amorces polyT, 

(d) I'hybridation en phase liquide d'une partie des ARN rA avec 
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une partie des ADN cB (pour generer des heteroduplex rA/cB) 

(e) Thybridation en phase liquide d'une partie des ARN rB avec 
une partie des ADN cA (pour generer des heteroduplex rB/cA), 

(f) Identification et/ou le clonage de regions d'ARN non 
5 appariees dans les heteroduplex rA/cB et rB/cA obtenus en (d) et en (e). 

Dans une autre variante particuliere de mise en oeuvre, le 
procede de Pinvention comprend Thybridation d'ARN provenant de la 
situation test avec les ADNc double-brins provenant de la situation de 
reference, et (Identification et/ou le clonage des regions d'ADN double-brin 

10 maintenues. Cette deuxieme variante repose plus particulierement sur la 
formation d'heterotriplex entre les ARN et les ADNc double-brin, derive des 
structures de^type R-loop (voir Figure 5). Cette variante est egalement 
preferentiellement mise en oeuvre en utilisant des ARN messagers ou des 
ADNc produits par transcription inverse des ARN messagers 

15 essentiellement, c'est-a-dire en presence d'une amorce polyT. Dans cette 
variante egalement, un mode de realisation particulier comprend deux 
hybridations paralleles, generant deux populations d'acides nucleiques selon 
('invention. Dans cette variante, les regions recherchees, specifiques des 
epissages alternatifs, ne sont pas les regions d'ARN non appariees, mais 

20 des ADN double-brins qui n'ont pu etre deplaces par une sequence ARN 
homologue (voir Figure 5). 

Dans une autre variante de Pinvention, le procede comprend, 
pour isoler les differences genetiques qualitatives (e.g., les differences 
d'epissage) qui existent entre deux echantillons, Phybridation entre une 

25 population d'ADNc double-brin provenant d'un premier echantillon biologique 
et une population d'ADNc (double-brin ou, preferentiellement simple-brin) 
provenant d'un deuxieme echantillon biologique (figure 6). 

A la difference des variantes presentees pr6cedemment, celle-ci 
n'utilise pas des heteroduplexes ou des heterotriplexes ADN/ARN mais des 

30 homoduplexes ADN/ADN. Cette variante est avantageuse puisqu'elle ne 
donne pas seulement acces aux exons et aux introns alternatifs mais 
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egalement, et a.Tinterieur d'une meme banque d'acides nucleiques, aux 
jonctions specifiques creees par deletion d'un exon ou d'un intron. De plus 
les sequences dans une telle banque donnent acces aux sequences 
flanquantes des exons et introns alternatifs. 
5 Pour les deux echantillons (i.e., conditions physiopathoiogiques) 

etudies, les ARN cytosoliques polyA+ sont extraits selon les techniques 
connues de I'homme de metier et decrites precedemment. Ceux-ci sont 
convertis en ADNc par Taction d'une transcriptase inverse depourvue ou non 
d'activite RNAse H intrinseque, comme decrit precedemment. L'un de ces 

10 ADNc simple brin est ensuite converti en ADNc double-brin par amorgage a 
I'aide d'hexameres aleatoires et selon les techniques connues de I'homme 
11 de Tart. Pour Tune des situations etudiees nous disposons done d'un ADNc 
simple-brin (appele "driver") et pour I'autre situation d'un ADNc double-brin 
(appele "tester"). Ces ADNc sont denatures par chauffage puis melanges de 

15 telle fagon que le driver est en exces par rapport au tester. Cet exces est 
choisi entre 1 et 50 fois, avantageusement 10 fois. Dans une experience 
donnee, menee a partir de deux situations physiopathoiogiques, le choix de 
la situation qui donne le driver est arbitraire et ne doit pas influencer la nature 
des informations recueillies. En effet, comme dans le cas des approches 

20 precedemment presentees, la strategie d'identification des differences 
qualitatives qui existent entre deux populations d'ARNm repose sur le 
clonage de ces differences presentes dans des messagers communs : la 
strategie repose sur le clonage de sequences presentes au sein de duplex et 
non de simples brins correspondent a des sequences singulieres ou en 

25 exces dans Tune des situations etudiees. Le melange des populations 
d'ADNc est precipite puis repris dans une solution contenant du formamide 
(par exemple 80%). L'hybridation est menee de 16 heures a 48 heures, 
avantageusement 24 heures. Les produits de cette hybridation sont 
precipites puis soumis a Taction d'une endonuclease de restriction ayant un 

30 site de reconnaissance de TADN double-brin dicte par 4 bases. Une telle 
enzyme de restriction va done diver TADNc double brin forme lors de 
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('hybridation en moyenne toutes les 256 bases. Cette enzyme est 
selectionnee avantageusement pour generer des sites cohesifs. Des 
exemples de telles enzymes sont fournis par des enzymes de restriction 
telles Sau3AI, Hpall, Taql et Msel. Sont done accessibles a une strategie de 
5 clonage utilisant les sites de restriction dives les fragments double-brin 
digeres par ces enzymes. Ces fragments sont de deux types : des fragments 
parfaitement hybrides, dont les deux brins sont parfaitement 
complementaires, et des fragments dont ('hybridation est partielle e'est a dire 
comprenant une boucle simple brin encadree par des regions double-brin 

10 (Figure 6A). Ces derniers fragments, minoritaires, contiennent les 
informations d'interet. Afin de les separer des fragments parfaitement 
hybrides, majoritaires puisque derives de la majorite de la longueur des 
ADNc, des techniques de separation sur gel ou sur toute autre matrice 
appropriee sont utilisees. Ces techniques mettent a profit le retard de 

15 migration, electrophoretique ou lors de gel filtration notamment, des 
fragments d'ADN qui contiennent une boucle d'ADN simple-brin. Ainsi les 
populations de fragments minoritaires qui contiennent les informations 
desirees peuvent etre separees de fagon preparative des populations de 
fragments majoritaires correspondant aux regions d'ADN identiques dans les 

20 deux populations. Cette variante, qui permet d'isoler au sein d'une meme 
population les empreintes positives et negatives liees a des differences 
qualitatives, peut egalement etre appliquee a des heteroduplexes ARN/ADN. 
A cet egard, un exemple de retard de migration d'un heteroduplexe 
ARN/ADN dans lequel une partie de TARN n'est pas appariee, par rapport a 

25 un heteroduplexe homologue dans lequel toutes les sequences sont 
appariees est illustre sur le modele grb2/grb33 decrit dans les exemples (voir 
notamment la figure 8, puits 2 et 3). 



30 



Identification et/ou Clonage 

A partir des populations d'acides nucleiques generees par 
hybridation, les regions caracteristiques des differences qualitatives (e.g., 
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des epissages. alternatifs differentiels) peuvent etre identifies par toute 
technique connue de rhomme du metier. 

Identification et/ou clonage a partir des heteroduplexes 

5 ARN/ADN 

Ainsi, dans le cas des heteroduplex ARN/ADN (premiere 
variante du procede), ces regions se presentent essentiellement sous forme 
de regions d'ARN non-appariees (boucles d'ARN), comme represents sur la 
Figure 3. Ces regions peuvent done etre identifies et donees par separation 

10 des heteroduplexes, et des acides nucleiques simple-brin (ADN, ARN) 
(exces d'acide nucleique n'ayant pas reagi), digestion selective des ARN 
double-brins (domaines engages dans les heteroduplex), puis separation des 
ARN simple-brin resultant et des ADN simple-brins. 

A cet egard, selon une premiere approche illustree sur la Figure 

15 3, les regions d'ARN non appariees sont identifies par traitement des 
heteroduplex au moyen d'une enzyme capable de digerer selectivement les 
domaines des ARN engages dans des heteroduplex ARN/ADN. Des 
enzymes douees de cette propriete sont decrites dans Part anterieur et sont 
disponibles dans le commerce. Ce sont les RNases H, telles que en 

20 particulier, celle de E. Coli produite sous forme recombinante et disponible 
dans le commerce (Promega Ref. M4281 ; Life Technologies Ref. 18021). 
Ce premier traitement genere done un melange comprenant les regions 
d'ARN non appariees simple-brin et les ADNc simple-brin. Les ARNs peuvent 
etre separes des ADNc par toute technique connue de I'homme du metier, et 

25 notamment sur la base du marquage des amorces utilisees pour la 
preparation des ADNc (voir ci-dessus). Ces ARN peuvent etre utilises 
comme source de materiel pour Tidentification de cibles, de produits 
genetiques d'interet ou toute autre application. Ces ARN peuvent egalement 
etre convertis en ADNc, puis clones dans des vecteurs, comme decrit ci- 

30 apres. 

A cet egard, le clonage des ARNs peut etre realises de 
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differentes fapons. L'une consiste a inserer a chaque extremite des ARN des 
oligonucleotides servant de matrice a une reaction de transcription inverse 
en presence des amorces correspondantes. Cet ajout d'amorces se fait 
selon les techniques bien connues de I'homme du metier grace a une 
5 enzyme, telle que par exemple la ARN ligase qui provient du phage T4 et qui 
catalyse la formation de liaisons phosphodiester intermoleculaires entre le 
phosphate en 5' d'une molecule donneuse et 1'hydroxyl en 3' d'une molecule 
acceptrice. Une telle ARN ligase est disponible commercialement (par 
exemple Life Technologies - GIBCO BRL Ref. 18003). Les ADNc ainsi 

10 obtenus peuvent ensuite etre amplifies par les techniques classiques (PCR 
par exemple) en utilisant les amorces appropriees, comme illustre sur la 
Figure 3. Cette technique est particulierement adaptee au clonage des ARN 
de petite taille (inferieure a 1000 b). 

Une autre approche pour le clonage et/ou ('identification des 

15 regions d'ARN specifiques consiste par exemple a realiser une transcription 
inverse, sur le produit de digestion par une enzyme specifique des ARN 
engages dans des double-brins, telle la Rnase H, en utilisant des amorces 
aleatoires, qui vont initier la transcription au hasard a Pinterieur des ARNs. 
Les ADNc obtenus sont ensuite amplifies selon les techniques classiques de 

20 biologie moleculaire, par exemple par PCR en utilisant des amorces grace a 
des oligonucleotides ajoutes aux extremites des ADNc grace a Taction de 
TARN ligase du phage T4 (disponible commercialement ; par exemple chez 
Life Technologies - GIBCO BRL ref. 18003). Cette seconde technique est 
illustree sur la Figure 4 et dans les exemples. Cette technique est plus 

25 particulierement adaptee aux ARNs de taille importante, et permet d'obtenir 
une partie de ('information de sequence, suffisante pour reconstituer par la 
suite la totalite de la sequence de depart. 

Une autre approche pour le clonage et /ou Identification des 
regions d'ARN specifiques repose egalement sur la realisation d'une 

30 transcription inverse en utilisant des amorces aleatoires (figure 4). 
Neanrnoins, selon cette variante, les amorces utilisees sont au moins en 
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partie des amorces semi-aleatoires, c'est-a-dire des oligonucleotides 
comprenant: 

- une region aleatoire (de degenerescence), 

- une zone minimale d'amorgage presentant un degre de 
contrainte defini, et 

- une zone stabilisatrice. 

De preference, il s'agit d'oligonucleotides comprenant, dans 
I'orientation 5' ~>3' : 

- une zone stabilisatrice comprenant 8 a 24 nucleotides 
determines, de preference de 10 a 18 nucleotides. Cette zone stabilisatrice 
peut elle-meme correspondre a la sequence d'un oligonucleotide utilise pour 
reampiifier les fragments issus des premieres amplifications realisees a I'aide 
des amorces semialeatoires de ('invention. En outre, la zone stabilisatrice 
peut comprendre la sequence d'un ou plusieurs sites, de preference non- 
palindromiques, correspondant a des enzymes de restriction. Ceci permet 
par exemple de faciliter le clonage des fragments ainsi amplifies. Un 
exemple particulier de zone stabilisatrice est represents par la sequence 
GAG AAG CGTTAT (residus 1 a 12 de SEQ ID NO:1); 

- une region aleatoire ayant de 3 a 8 nucleotides, plus 
particulierement de 5 a 7 nucleotides, et 

- une zone minimale d'amorgage definie de sorte que 
('oligonucleotide s'hybride en moyenne au moins toutes les 60 pb environ, de 
preference toutes les 250 pb environ. Plus preferentiellement, la zone 
d'amorgage comporte de 2 a 4 nucleotides definis, preferentiellement 3 ou 4, 
tels que par exemple AGGX, ou X represente I'une des quatre bases A, C, G 
ou T. La presence d'une telle zone d'amorgage confere a Toligonucleotide la 
capacite d'hybrider en moyenne toutes les 256 paires de bases environ. 

De maniere particulierement preferee, il s'agit 
d'oligonucleotides de formule : 

GAGAAGCGTTATNNNNNNNAGGX (SEQ ID NO: 1) ou les 
bases fixees ont ete ordonnees de fagon a minimiser le bruit de fond du a 
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des auto-appariements dans des experiences de PGR, ou N indique que les 
quatre bases peuvent etre presentes de fagon aleatoire a la position 
indiquee, et ou X represente Tune des bases A, C, G ou T. De tels 
oligonucleotides constituent egalement un objet de la presente invention. 
5 A cet egard, de fagon a augmenter les possibilites d'amorgage 

sur les ARN a doner, des reactions en parallele peuvent etre effectuees 
avec des oligonucleotides tels que : 

GAGAAGCGTTATNNNNNNNAGGT (oligonucleotides A) 
G AG AAG C GTTATN N N N N N NAG G A (oligonucleotides B) 
io G AG AAG CGTTATN N N N N N N AGGC (oligonucleotides C) 

GAGAAGCGTTATNNNNNNNAGGG (oligonucleotides D), 
chaque population d'oligonucleotides (A, B, C, D) pouvant etre utiiisee 
individuellement ou en combinaison avec une autre. 

Apres I'etape de transcription inverse, les ADNc sont amplifies 
15 par PCR en utilisant les oligonucleotides A ou B ou C ou D. 

Comrne indique ci-avant t selon la complexity et la specificite de 
la population des oligonucleotides souhaitee le nombre de positions 
- degenerees peut varier de 3 a 8, de preference de 5 a 7. En dega de 3 les 
hybridations sont restreintes et au dela de 8 la population d'oligonucleotides 
20 est trap complexe pour assurer une bonne amplification de bandes 
specifiques. 

Par ailleurs, la longueur de I'extremite 3' fixe (la zone 
d'amorgage contrainte) de ces oligonucleotides peut egalement etre 
modifiee : si (es amorces decrites plus haut, avec 4 bases fixees, permettent 

25 d'amplifier en moyenne des fragments de 256 paires de bases, des amorces 
avec 3 bases fixes permettent d'amplifier des fragments plus courts (64 
paires de bases en moyenne). Dans un premier mode prefere de Invention, 
on utilise des oligonucleotides dans lesquels la zone d'amorgage comprend 4 
bases fixes. Dans un autre mode prefere de invention, on utilise des 

30 oligonucleotides ayant une zone d'amorgage de trois bases fixes. En effet, 
les exons ayant une taille moyenne de 137 bases, ceux-ci sont 
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avantageusement amplifies avec de tels oligonucleotides. A cet egard, voir 
egalernent les oligonucleotides de sequence SEQ ID NO: 2, 3 et 4, par 
exemple. 

Enfin, generalement, I'etape d'identification et/ou de clonage 
5 des ARN met en oeuvre les differentes methodes de PCR et de clonage, de 
maniere a obtenir I'information la plus complete. 

. Identification et/ou clonage a partirdes heterotriplexes. 
Dans le cas des heterotriplexes (autre variante du procede), les 
10 regions de differences qualitatives (insertions, deletions, epissages 
differentiels) se presentent essentiellement sous forme de regions d'ADN 
double-brin, comme represents sur la Figure 5. Ces regions peuvent done 
etre identifies et donees par traitement en presence d ! enzymes appropriees 
telles qu*une enzyme permettant de digerer les ARN, puis une enzyme 
is permettant de digerer les ADN simple-brin. Les acides nucleiques ainsi 
- obtenus sont done directement sous forme d'ADN double-brin et peuvent 
etre clones dans tout vecteur approprie, tel le vecteur pMos-Blue 
(Amersham, RPN 5110), par exemple. Cette methodologie est a differencier 
des approches deja decrites utilisant des ARNs ou oligonucleotides de 
20 sequences predetermines, modifies pour exercer une activite nucleasique 
(Landgraf et al. (1994) Biochemistry, 33, 10607-10615). 

. Identification et/ou clonage a partir des homoduplexes 
ADN/ADN (figure 6). 

25 Les fragments isoles par leurs structures atypiques sont ensuite 

additionnes, a chacune de leurs extremites, d'adaptateurs, ou linkers, ayant 
des sites de restriction dives a Tune de leurs extremites. Cette etape peut 
etre realisee selon les techniques connues de I'homme du metier, par 
exemple par ligation avec I'ADN ligase du phage T4. Les sites de restriction 

30 ainsi introduits sont choisis compatibles avec les sites des fragments 
d'ADNc. Les linkers introduits sont des sequences d'ADNc double-brin, de 
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sequences connues, permettant de deriver des amorces pour realiser des 
amplifications enzymatiques (PCR). Puisque Tetape suivante consiste a 
amplifier les deux brins qui presentent entre eux les differences qualitatives a 
identifier, il est necessaire d'utiliser des linkers dont les extremites 5* sont 
5 phosphorylees. Ainsi apres denaturation thermique des ADNc double-brin 
additionnes de linkers, chacune des extremites de ces ADNc est liee de 
fagon covalente avec une sequence d'amorgage specifique. Apres PCR a 
I'aide des amorces specifiques appropriees, deux categories d'ADNc double- 
brin sont obtenues: des fragments qui contiennent des sequences 

10 specifiques de differences qualitatives qui distinguent les deux situations 
physiopathologiques, et des fragments qui comprennent I'empreinte negative 
de ces evenements d'epissages. Le clonage de ces fragments permet 
d'obtenir une banque d'epissages alternatifs dans laquelle, pour chaque 
evenement d'epissage, des empreintes positives et negatives sont 

is presentes. Dans cette banque, sont done accessibles non seulement les 
exons et les introns alternatifs mais aussi les jonctions specifiques creees 
par excision de ces sequences epissees. Dans une meme banque, ces 
differentes informations genetiques peuvent provenir des deux situations 
physiopathologiques sans discrimination. Par ailleurs, de fagon a verifier le 

20 caractere differentiel des epissages identifies et de fagon a determiner dans 
quelle situation ceux-ci sont specifiquement recrutes, les clones de la banque 
peuvent etre hybrides avec des sondes derivees de chacune des populations 
totales des ARNm. 

25 Deux usages principaux peuvent etre envisages pour les 

fragments d'ADNc issus des differences qualitatives identifies : 

- Leur clonage dans des vecteurs appropries de fagon a 
constituer des banques representatives des differences qualitatives qui 
existent entre les deux situations physiopathologiques etudiees, 

30 - Leur utilisation en tant que sondes afin de cribler une banque 

d'ADN permettant d'identifier les evenements episses de fagon differentielle. 
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Les vecteurs utilises dans invention peuvent etre notamment des 
plasmides, cosmides, phages, YAC, HAC, etc. Ces acides nucleiques 
peuvent ainsi etre conserves tels quels ou introduits dans des 
microorganismes adaptes au vecteur de clonage utilise, afin d'etre multiplies 
5 et/ou conserves sous forme de cultures. 

Les m6thodes telles que decrites ci-dessus sont generalement 
mises en oeuvre, pour chaque echantillon, sur une periode de temps de 
moins de deux mois, en particulier moins de 6 semaines. Par ailleurs, ces 
differentes methodes peuvent etre automatisees afin de reduire la duree 
10 totale et de faciliter le traitement de nombreux echantillons. 

A cet egard, un autre objet de Pinvention concerne les acides 
nucleiques identifies et/ou clones par les methodes de Pinvention. Comme 
indique ci-dessus, ces acides nucleiques peuvent etre des ARN ou des 
ADNc. Plus generalement, Pinvention concerne une composition decides 
15 nucleiques, comprenant essentiellement des acides nucleiques 
correspondant aux epissages alternatifs distinguant deux situations 
physiologiques. Plus particulierement, ces acides nucleiques correspondent 
aux epissages alternatifs identifies dans un echantillon biologique test et non 
presents dans le meme echantillon biologique dans une situation de 
20 reference. L'invention a egalement pour objet Putilisation des acides 
nucleiques ainsi clones comme produit therapeutique ou diagnostic, ou 
comme outil de criblage de molecules actives, comme indique ci-apres. 

Les differentes methodes exposees ci-dessus aboutissent done 
toutes au clonage de sequences d'ADNc qui represented information 
25 genetique epissee differentiellement entre deux situations 
physiopathologiques. L'ensemble des clones issus de Pune de ces methodes 
permet done la constitution d'une banque representative des differences 
qualitatives qui existent entre deux situations etudiees. 

30 Generatio n de banques qualitative?; 

A cet egard, Pinvention concerne en outre un procede de 
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preparation d'une banque cTacides nucleiques representatifs d'un etat 
physiologique donne d'un echantilion biologique. Ce precede comprend 
avantageusement le clonage d'acides nucleiques representatifs des 
marqueurs qualitatifs d'expression genetiques (par exemple des epissages 
5 alternatifs) dudit etat physiologique et non presents dans un etat de 
reference, dans des banques specifiques de differences qualitatives qui 
existent entre les 2 etats etudies. 

Ces banques sont constitutes d'ADNc inseres dans des 
vecteurs plasmidiques ou phagiques. Ces banques peuvent etre presentees 

10 sur des filtres de nitrocellulose ou tout autre support connu de I'homme de 
Tart, tels des chips qu biopuces. 

L'une des caracteristiques et en meme temps Tune des 
originates du criblage differentiel qualitatif est que cette technique aboutit a 
non pas une mais avantageusement deux banques differentielles qui 

is represented I'ensemble des differences qualitatives qui existent entre deux 
situations donnees : Paire de banque (voir figure 1D). 

Ainsi, ('invention concerne de preference toute composition ou 
banque d'acides nucleiques, susceptible d'etre obtenue par hybridation entre 
une population d'ARN provenant d'un premier echantilion biologique et une 

20 population d'ADNc provenant d'un deuxieme echantilion biologique. Plus 
preferentiellement, les banques ou compositions de Pinvention comprennent 
des acides nucleiques representatifs des differences qualitatives 
d'expression entre deux echantillons biologiques, et sont produites par un 
precede comprenant (i) une etape au moins d'hybridation entre une 

25 population d'ARN provenant d'un premier echantilion biologique et une 
population d'ADNc provenant d'un deuxieme echantilion biologique, (ii) la 
selection des acides nucleiques representatifs des differences qualitatives 
d'expression et, eventuellement (iii) le clonage desdits acides nucleiques. 

En outre, apres constitution de telles banques, il est possible 

30 d'effectuer une etape de selection des clones pour ameliorer la specificite 
des banques obtenues. En effet, il est possible que certains 
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mesappariements observes ne soient pas uniquement dus a differences 
qualitatives (e.g. a des epissages alternatifs differentiels), mais puissent 
resulter de defaut(s) de ia transcription inverse par exemple. Bien que ces 
evenements ne soient pas generalement significatifs, il est preferable de les 
5 eiiminer ou de les reduire prealablement au clonage des acides nucleiques. 
Pour ce faire, les clones de la banque peuvent etre hybrides avec les 
populations d'ADNc des deux situations physiologiques etudiees (voir etape 
(c) ci-dessus). Les clones hybridant de fagon non differentielle avec les deux 
populations peuvent etre consideres comme non-specifiques et 

io eventuellement elimines ou traites en deuxieme priorite (en effet, I'apparition 
d'une nouvelle isoforme dans I'echantilion test ne signifie pas toujours que 
I'isoforme initiate presente dans I'echantillon de reference a disparu de cet 
echantillon test). Les clones n'hybridant qu'avec une seule des deux 
populations ou hybridant de fagon preferentielle avec Tune des populations 

15 sont consideres comme specifiques et peuvent etre selectionnes en premiere 
priorite pour constituer des banques enrichies ou affinees. 

Un affinage peut egalement etre realise par hybridation et 
validation de clones avec des sondes provenant d f un nombre statistiquement 
relevant d'echantillons pathologiques. 

20 La presente demande a done egalement pour objet toute 

banque d'acides nucleiques comprenant des acides nucleiques specifiques 
d'epissages alternatifs caracteristiques d'une situation physiologique. Ces 
banques sont avantageusement constitutes d'ADNc, generalement double 
brin, correspondent aux regions d'ARN specifiques d f un epissage alternatif. 

25 Ces banques peuvent etre constitutes des acides nucleiques, generalement 
dans un vecteur de clonage ou de cultures cellulaires contenant lesdits 
acides nucleiques. 

Le choix des ARN de depart determine en partie les 
caracteristiques des banques obtenues : 

30 - les ARN des deux situations A et B sont des ARNm ou des 

ARN totaux matures isoles selon les techniques connues de Thomme de Tart. 
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Les banques sont alors des banques de criblage differentiel qualitatif dites 
restreintes, car restreintes aux differences qualitatives qui caracterisent les 
ARN matures des deux situations physiopathologiques. 

- Les ARN de Pune des situations sont des ARNm ou totaux 
5 matures alors que les ARN de Pautre situation sont des ARN premessagers, 
non matures par epissage, isoles selon les techniques connues de Phomme 
de Tart, a partir de noyaux cellulaires. Dans ce cas les banques obtenues 
sont des banques de criblage differentiel dites complexes, puisque non 
restreintes aux differences entre ARN matures mais comprenant tout le 

10 repertoire des epissages transcrits dans une situation et elimines dans 
Pautre, dont tous les introns. 

enfin, les ARN peuvent provenir d'une seule situation 
physiopathologique et dans ce cas le criblage differentiel implique les ARN 
matures et les premessagers d'un meme echantillon. Dans ce cas, les 

15 banques obtenues sont des banques de criblage differentiel qualitatif 
autologues. L'interet de telles banques est qu'elles rassemblent 
exclusivement le repertoire des introns transcrits dans une situation donnee. 
Leur hybridation avec une sonde provenant d'ARN matures d'une autre 
situation determine rapidement si a cette situation est caracterisee par une 

20 retention d'introns tout en permettant aisement leur identification. 

Generalement, les banques sont generees par etalement, sur 
milieu solide (notamment sur milieu gelose), d'une culture cellulaire 
transformee par les acides nucleiques clones. La transformation est realisee 
par toute technique connue de Phomme du metier (transfection, phosphate 

25 de calcium, electroporation, infection par des bacteriophages, etc). La culture 
cellulaire est generalement une culture de bacteries, telles que par exemple 
les bacteries E. coli. II peut egalement s f agir de cultures de cellules 
eucaryotes, notamment de cellules eucaryotes inferieures (levures par 
exemple). Cet etalement peut etre realise sur boite ou sur tout autre support 

30 adapte, en conditions steriles. En outre, ces cultures etalees en milieu gelose 
peuvent etre stockees sous forme congelee par exemple (dans du glycerol 
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ou autre agent adapte). Ces banques peuvent naturellement etre utilisees 
pour la production de "repliques", c'est-a-dire de copies selon les techniques 
habituelles detaillees ci-apres. En outre, ces banques servent generalement 
a preparer une banque amplifiee, c'est-a-dire une banque comprenant 
5 chaque clone sous forme amplifiee. Une banque amplifiee est preparee 
comme suit : a partir de la culture etalee, tous les clones cellulaires sont 
recuperes et sont conditionnes pour etre conserves sous forme congelee ou 
au froid, dans tout milieu adapte. Cette banque amplifiee est 
avantageusement realisee a partir de cultures de bacteries E.coli, et 

10 conservee a 4°C, en conditions steriles. Cette banque amplifiee permet la 
preparation et la reproduction illimitee de toute banque ulterieure contenant 
ces clones, sur differents supports, pour differentes applications. Une telle 
banque permet en outre I'isolement et la caracterisation de tout clone 
d'interet. Chacun des clones constituant les banques de I'invention est en 

is effet un element caracteristique d'une situation physiologique, et constitue 
done une cible particulierement interessante pour differentes etudes telles 
que la recherche de marqueurs, la preparation d'anticorps, le diagnostic, le 
traitement pour transfert de genes, etc. Ces differentes applications sont 
discutees plus en detail plus loin. La banque est generalement preparee 

20 comme decrit ci-dessus par etalement des cultures dans un milieu gelose, 
sur un support adapte (boite de petri par exemple). L'interet d^tiliser un 
milieu gelose est que chaque colonie peut etre separee et individualisee. A 
partir de cette culture, des repliques a Tidentique peuvent etre preparees en 
quantites importantes par simple "replique" sur tout support approprie selon 

25 les techniques de I'homme de Tart. Ainsi, la replique peut etre realisee au 
moyen de filtres, membranes (nylon, nitrocellulose, etc) permettant 
Taccrochage des cultures. Les filtres peuvent ensuite etre stockes en Tetat, a 
4°C par exemple, sous forme dessechee, dans tout type de conditionnement 
qui n'altere pas les acides nucleiques. Les filtres peuvent egalement etre 

30 traites de maniere a eliminer les cellules, proteines, etc, et a ne conserver 
que des composants tels que les acides nucleiques. Ces traitement peuvent 
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comprendre notamment des proteases, des detergents, etc. Les filtres traites 
peuvent egalement etre conserves . dans tout dispositif ou toute condition 
adaptes aux acides nucleiques. 

Les banques d'acides nucleiques peuvent egalement etre 
5 preparees directement a partir des acides nucleiques, par depot sur des 
biopuces ou tout autre dispositif approprie. 

L'invention concerne egalement toute banque comprenant des 
oligonucleotides specifiques d'epissages alternatifs distinguant deux 
situations physiologiques. II s'agit avantageusement d'oligonucleotides 
10 simple-brin, comprenant de 5 a 100-meres, de preference moins de 50- 
meres, par exemple autour de 25-meres environ. 

Ces oligonucleotides sont specifiques d'epissages alternatifs 
representatifs d'une situation ou d'un type de situation physiologique. Ainsi, 
de tels oligonucleotides peuvent etre par exemple des oligonucleotides 
is representatifs d'evenements d'epissages alternatifs caracteristiques de 
situations d'apoptose. II a en effet ete decrit dans la litterature que certains 
epissages alternatifs etaient observes dans le cadre de situations 
apoptotiques. II s f agit par exemple d'epissages dans les genes Bclx, Bax, 
Fas ou Grb2 notamment. A partir des donnees publiees et des sequences 
20 accessibles dans la litterature et/ou sur bases de donnees, il est possible de 
creer des oligonucleotides specifiques des formes epissees et non epissees. 
Ces oligonucleotides peuvent par exemple etre crees selon la strategie 
suivante : 

(a) identification d'une proteine ou d'un evenement d'epissage 
25 caracteristique d'une situation d'apoptose et de la sequence du domaine 

episse. Cette identification peut etre basee sur des donnees publiees ou par 
compilation de sequences accessibles sur bases de donnees; 

(b) synthese artificielle d f un ou plusieurs oligonucleotides 
correspondant a une ou plusieurs regions de ce domaine, qui permettent 

30 done par hybridation de mettre en evidence la forme non 6pissee dans les 
ARN d'un echantillon test; 
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(c.) synthese artificielle d'un ou plusieurs oligonucleotides 
correspondant a la region de jonction entre les deux domaines separes par 
le domaine episse. Ces oligonucleotides permettent done par hybridation de 
mettre en evidence la forme epissee dans les ARN d*un echantillon test; 
5 (d) reproduction des etapes (a) a (c) ci-dessus avec d'autres 

proteines ou evenements d'epissages caracteristiques d'une situation 
d'apoptose; 

(e) transfert sur un premier support approprie du ou des 
oligonucleotides specifiques des formes apoptotiques des messagers 

10 identifies ci-avant et, sur un autre support approprie, du ou des 
oligonucleotides specifiques des formes non-apoptotiques. 

Les deux supports ainsi obtenus peuvent etre utilises pour 
tester I'etat physiologique de cellules ou echantillons tests, et notamment leur 
etat apoptotique, par hybridation d'une preparation d'acides nucleiques de 

is ces cellules ou echantillons. 

D'autres banques similaires peuvent etre generees avec des 
oligonucleotides specifiques d'etats physiopathologiques differents 
(neurodegenerescence, toxicite, proliferation, etc.) et ainsi permettre un 
elargissement des domaines d'applications. 

20 Des banques dlntrons ou d'exons alternatifs peuvent aussi etre 

des banques de donnees informatiques constitutes par analyse 
systematique des banques de donnees qui regroupent les informations 
relatives au genome de tel ou tel organisme, tissu ou culture cellulaire. Dans 
ce cas, les donnees obtenues par constitution de telles banques virtuelles 

25 peuvent etre utilisees pour generer des amorces oligonucleotidiques qui 
seront utilisees pour tester en parallele deux situations physiopathologiques. 

Les donnees des banques informatiques peuvent egalement 
etre utilisees pour deriver des sondes nucleotidiques generales, 
representatives d'une elasse de proteines ou encore specifiques d'une 

30 sequence definie. Ces sondes peuvent ensuite etre appliquees sur les 
banques de clones issues des differentes techniques de clonage des introns 
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et exons alternatifs afin d'obtenir une image de la complexity de ces banques 
moleculaires et de determiner rapidement si telle ou telle classe de proteines 
ou telle ou telle sequence determinee est epissee differentiellement entre 
deux etats physiopathologiques distincts. 
5 Une autre banque ou compositions d'acides nucleiques selon 

Tinvention est une banque antisens, realisee a partir des sequences 
identifies selon les methodes de Tinvention (DATAS). Pour la realisation de 
ce type de banques, ces sequences sont donees de fa?on a etre exprimees 
en fragments d'ARN correspondant a une orientation antisens par rapport 

10 aux ARN messagers sur lesquels ont ete realises DATAS. On aboutit ainsi a 
une banque dite antisens. Cette approche utilise de preference la variante de 
clonage qui permet une orientation des fragments clones. L'interet d'une telle 
banque antisens est de permettre la transfection de lignees cellulaires et de 
suivre Alteration de tout phenotype qu'il soit d'ordre morphologique, 

15 enzyrnatique ou suivi par ('utilisation de genes rapporteurs ou de resistance a 
un agent de selection, L'analyse des variations phenotypiques consecutives 
a Introduction d'un vecteur d'expression antisens se fait generalement apres 
selection de clones dits stables, c'est a dire permettant une replication 
coordonnee du vecteur d'expression et du genome de I'hote. Cette 

20 coordination est permise par 1'integration du vecteur d'expression dans l.e 
genome cellulaire ou, lorsque le vecteur depression est episomal, par 
pression de selection. Cette pression de selection se fait par traitement de ia 
culture cellulaire transfectee avec un agent toxique qui ne peut etre detoxifie 
que lorsque le produit d'un gene porte par le vecteur d'expression est 

25 exprirne dans la cellule. II s'ensuit une synchronisation entre ia replication de 
I'hote et celle du transgene. Avantageusement, on utilise des vecteurs 
episomaux derives du virus Epstein-Barr qui permettent I'expression dans 
une meme cellule de 50 a 100 copies du vecteur (Deiss et al, 1996, EMBO 
J., 15, 3861-3870 ; Kissil et al, 1995, J. Biol. Chem, 270, 27932-27936). 

30 L'interet de ces banques antisens alliees aux sequences 

DATAS qu'elles contiennent est d'identifier non seulement quel gene a eu 
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son expression inhibee pour amener au phenotype selectionne mais aussi 
d'identifier quelle isoforme d'epissage de ce gene a ete affectee. Lorsque le 
fragment antisens cible un exon donne, il peut en etre deduit que le domaine 
proteique et done la fonction impliquant ce domaine s'oppose au phenotype 
5 observe. En cela le couplage de DATAS avec une approche antisens 
represente un raccourci vers la genomique fonctionnelle. 

Puces a ADN 

L'invention concerne egalement tout support (membrane, filtre, 

10 biopuce, chip, etc) comprenant une banque ou une composition d'acides 
nucleiques telle que definie ci-dessus. II peut s'agir plus particulierement 
d'une banque cellulaire ou d'une banque d'acides nucleiques. L'invention 
concerne egalement tout kit ou support comprenant plusieurs banques selon 
Tinvention. En particulier, il peut etre avantageux d'utiliser en parallele une 

is banque representative des qualites d'un etat physiologique test par rapport a 
un etat physiologique de reference et, a titre de contrdle, une banque 
representative des qualites de Tetat physiologique de reference par rapport a 
Tetat physiologique test ("paire de banques"). Un kit avantageux selon 
Tinvention comprend done deux banques qualitatives differentielles de deux 

20 situations physiologiques (une "paire de banques"). Selon un mode de 
realisation particulier, les kits de Tinvention comprennent plusieurs paires de 
banques telles que definies ci-dessus, correspondant a differents etats 
physiologiques ou a differents echantillons biologiques par exemple. Les kits 
peuvent comprendre par exemple ces differentes paires de banques 

25 deposees en serie sur un meme support. 

Generation de sondes 

Une autre utilisation des compositions d'ADNc selon Tinvention, 
representatifs des differences qualitatives qui existent entre deux etats 
30 physiopathologiques, consiste a en deriver des sondes. De telles sondes 
peuvent en effet etre utilisees pour cribler les evenements episses de fagon 
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differentielle entre deux situations physiopathologiques. 

Ces sondes (voir figure 1D) peuvent etre preparees par marquage des 
populations ou banques d'acides nucleiques selon les techniques 
classiques, connues de I'homme du metier. Ainsi, il peut s'agir de marquage 
5' enzymatique, radioactif, fluorescent, immunologique, etc. Preferentiellement, 
il s'agit d'un marquage radioactif ou fluorescent. Ce type de marquage peut 
etre realise par exemple en " introduisant sur la population d'acides 
nucleiques (soit apres synthese soit au cours de leur synthese) des 
nucleotides marques, permettant leur revelation par les methodes 

10 conventionnelles. 

Une application est done de cribler une banque genomique 
classique. Une telle banque peut comprendre selon le vecteur, derive d'un 
phage ou d'un cosmide, des fragments d'ADN de 10kb a 40kb. Le nombre 
de clones hybridant avec les sondes generees par DATAS et representatifs 

is des differences d'epissage qui existent entre deux situations reflete done a 
peu pres le nombre de genes affectes par des variations d'epissage, selon 
qu'ils sont exprimes dans Tune ou I'autre des situations etudiees. 

De preference, les sondes de I'invention sont utilisees pour 
cribler une banque d'ADN genomique (generalement humaine) adaptee a 

20 I'identification d'evenements d'epissage. De preference, une telle banque 
genomique est composee de fragments d'ADN de taille restreinte 
(generalement clones dans des vecteurs), de fagon a statistiquement ne 
recouvrir qu'un seul element epissable differentiellement, e'est a dire un seul 
exon ou un seul intron. La banque d'ADN genomique est done preparee par 

25 digestion d'ADN genomique avec une enzyme ayant un site de 
reconnaissance restreint par 4 bases, assurant ainsi la possibility d'obtenir 
par digestion menagee des fragments d'ADN de taille moyenne de 1kb. De 
tels fragments necessitent I'obtention de 10 7 clones pour constituer une 
banque d'ADN representative d'un genome d'organisme eucaryote 

30 superieur. Une telle banque constitue egalement un objet de la presente 
demande. Cette banque est ensuite hybridee avec les sondes derivees du 



WO 99/46403 



34 



PCT/FR99/00547 



criblage differentiel qualitatif. Precisement, de chaque experimentation 
consideree et qui compare deux situations physiopathologiques A et B, deux 
sondes (paire de sondes) sont obtenues. Une sonde enrichie en 
evenements d'epissages caracteristiques de la situation A et une sonde 
5 enrichie en marqueurs d'epissage de B. Les clones de ia banque genomique 
qui hybrident preferentiellement avec Tune ou I'autre sonde portent des 
sequences preferentiellement epissees dans les situations 
physiopathologiques correspondantes. 

Les methodes de Tinvention permettent ainsi 1'identification 
10 systematique de differences qualitatives d'expression genique. Ces 
methodes presentent de nombreuses applications, dans ['identification et/ou 
le clonage de molecules d'interet, en toxicologie, en pharmacologic ou 
encore en pharmacogenomique par exemple. 

15 Applications 

L'invention concerne done egalement Tutilisation des methodes, 
acides nucleiques ou banques decrite ci-dessus pour ('identification de 
molecules d'interet therapeutique ou diagnostique. L'invention concerne plus 
particulierement Tutilisation des methodes, acides nucleiques ou banques 

20 decrite ci-dessus pour ('identification de proteines ou domaines proteiques 
affectes dans une pathologie. 

L'un des atouts de ces techniques est en effet d'identifier a 
Tinterieur d'un messager, et par consequent de la proteine correspondante, 
les domaines fonctionnels qui sont affectes dans une pathologie donnee. 

25 Cela permet d'assigner a un domaine donne une importance dans le 
developpement ou le maintien d'un etat pathologique. Uavantage imm6diat 
de restreindre a un domaine precis d'une proteine I'impact d*une deregulation 
pathologique est de proposer celui-ci comme une cible relevante pour un 
criblage de petites molecules a visee therapeutique. Ces informations 

30 constituent egalement des clefs qui permettent de concevoir des 
polypeptides a activite therapeutique delivrables par therapie genique; Ces 
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polypeptides peuvent notamment etre des anticorps simples chaines derives 
d'anticorps neutraiisants diriges contre les domaines identifies par les 
techniques decrites ci avant. 

Plus specifiquement, les methodes selon I'invention permettent 
5 d'obtenir des molecules qui peuvent: 

- etre des sequences codantes qui derivent d'exons altematifs. 

- corresponds a des sequences non codantes portees par des 
introns episses differentiellement d'un etat physiopathologique a un autre. 

De ces deux points, differents enseignements peuvent etre 

10 tires. 

Les epissages altematifs d'exons qui differencient deux etats 
physiopathologiques traduisent un niveau de regulation de ['expression 
genetique qui permet de moduler ( plus precisement d'abolir ou d'instaurer) 
une ou plusieurs fonctions d'une proteine donnee. Ainsi la plupart des 
15 domaines structuraux et fonctionnels (SH2 t SH3, PTB, PDZ, et les domaines 
catalytiques de differentes enzymes...) etarit codes par plusieurs exons 
contigus, deux configurations peuvent se presenter : 

i) Les domaines sont tronques dans la situation 
pathologique (Zhu, Q. et al, 1994, J. Exp. Med., vol 180, n°2, pp461-470); 

20 cela indique que les chemins de signalisation impliquant ces domaines 
doivent etre restaures dans un but therapeutique. 

ii) Les domaines sont maintenus au cours d'une 
pathologie alors qu'ils sont absents dans une situation saine; ces domaines 
peuvent etre consideres comme des cibles de criblage de petites molecules 

25 chimiques destinees a antagoniser les signaux transduits par I'intermediaire 

de ces domaines. 

Les sequences epissees differentiellement peuvent 

correspondre a des regions non-codantes situees en 5 1 ou en 3 1 de la 

sequence codante ou a des introns intervenant entre deux exons codants. 
30 Dans les regions non codantes, ces epissages differentiels peuvent traduire 

une modification de la stabilite ou de la traductibilite du messager (Bloom, T. 
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J., and Beavo„ J. A., 1995, Proc. Natl. Acad. Sci. USA, vol93 t n° 24, pp 
14188-14192; Ambartsumian, N. et al., 1995, Gene, vol 159, n° 1, pp 125- 
130). Ces phenomenes doivent alors etre recherches sur la base de ces 
informations et peuvent mettre en evidence que [•accumulation ou la 
disparition de la proteine correspondante la designe ainsi comme cible 
d'interet. Lorsque la retention d'un intron se produit dans une sequence 
codante, il s'ensuit le plus souvent une troncature de la proteine naturelle par 
introduction de codon stop dans la phase de lecture (Varesco, L, et al, 1994, 
Hum. Genet., vol 93, n°3, pp281-286; Canton, H., et al., 1996, Mol. 
Pharmacol., vol 50, n° 4, pp799-807, Ion, A., et al, 1996, Am. J. Hum. 
Genet, vol 58, n°6, pp1 185-1 191). Avant de rencontrer ce codon stop, il se 
produit generalement une lecture de quelques codons supplementaires, ce 
qui aboutit a adjoindre a la partie deja traduite une sequence specifique, 
temoin proteique de Tepissage alternatif. Ces acides amines 
supplementaires peuvent etre utilises pour generer des anticorps specifiques 
de la forme alternative caracteristique de la situation pathologique. Ces 
anticorps peuvent etre ensuite utilises comme outiis de diagnostic. La 
proteine tronquee voit ses proprietes modifiees, voire alterees. Ainsi des 
enzymes peuvent etre amputees de leur domaine catalytique ou de leur 
domaine regulateur, devenant inactives ou constitutivement activees. Des 
adaptateurs peuvent perdre leur capacite a connecter differents partenaires 
d 'une cascade de signalisation(Watanabe, K. et al, 1995, J. Biol. Chem., vol 
270, n°23, pp1 3733-1 3739). Les produits d'epissage des recepteurs peuvent 
aboutir a des recepteurs qui ont perdu leur capacite a lier leur ligand 
(Nakajima, T. et al, 1996, Life Sci., vol58, n°9, pp761-768) et peuvent 
egalement generer des formes de recepteurs solubles par relargage de leur 
domaine extracellulaire (Cheng J. t 1994, Science, vol263, n° 5154, pp1759- 
1762). Dans ce cas, des tests diagnostiques peuvent etre envisages, bases 
sur la circulation dans les differents fluides physiologiques de forme soluble 
de recepteur a un ligand donne. 

^invention concerne plus particulierement futiiisation des 
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methodes, acides nucleiques ou banques decrits ci-dessus pour 
Tidentification de domaines antigeniques specifiques de proteines impliquees 
dans une pathologie. ^invention concerne egalement 1'utilisation des acides 
nucleiques, proteines ou peptides tels que decrits ci-avant pour le diagnostic 
5 de pathologies. 

L'invention concerne egalement une methode d'identification 
et/ou de production de proteines ou domaines proteiques impliques dans une 
pathologie comprenant : 

(a) Phybridation des ARN messagers d'un echantillon 
10 pathologique avec les ADNc d'un echantillon sain, ou ('inverse, ou les deux 

en parallele, 

(b) ('identification, dans les hybrides formes, des regions 
correspondant aux differences qualitatives (non appariees (ARN) ou 
appariees (ADN double brin)), specifiques de Tetat pathologique par rapport 

is a Tetat sain, 

(c) Tidentification et/ou la production de la proteine ou domaine 
proteique correspondant a une ou plusieurs regions identifiees en (b). 

Les regions identifiees correspondent generalement a des 
epissages differentiels, mais il peut egalement s'agir d'autres alterations 
20 genetiques telles que insertion(s) ou deletion(s), par exempie. 

La ou les proteines ou domaines proteiques peuvent etre isoles, 
sequences, et utilises dans des applications therapeutiques ou 
diagnostiques, notamment pour la preparation d'anticorps. 

A titre d'exemple plus specifique, le criblage differentiel qualitatif 
25 de invention permet avantageusement de mettre en evidence des genes 
suppresseurs de tumeurs. En effet, de nombreux exemples indiquent que 
Tun des modes deactivation des genes suppresseurs au cours de la 
progression tumorale est une inactivation par modulation de Tepissage de 
formes alternatives. 

30 Ainsi, dans les carcinomes pulmonaires a petites cellules, le 

gene de la proteine p130 qui appartient a la famille RB (proteine du 
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retinoblastoma) est mute a un site consensus d'epissage. La consequence 
de cette mutation est I'elimination de I'exon 2 et une non synthese de 
proteine due a la presence d'un codon stop precoce. Cette observation a 6te 
la premiere a souligner I'importance des membres de la famille RB dans la 
5 tumorigenese. De meme, dans certains cancers du poumon non a petites 
cellules, le gene de la proteine p16INK4A, proteine qui est un inhibiteur des 
kinases cyclines-dependantes cdk4 et cdk6 est mute dans un site donneur 
d'epissage. Le resultat de cette mutation est la production d'une proteine 
tronquee a demi-vie courte ce qui a pour consequence ('accumulation des 

10 formes phosphorylees, inactives, de RB. Par ailleurs, WT1, le gene 
suppresseur de tumeur de Wilms, est transcrit en plusieurs ARN messagers 
generes par epissages altematifs. Dans les cancers du sein, les proportions 
relatives des differents variants sont modifiees par rapport au tissu sain, 
fournissant des outils diagnostics et des pistes pour comprendre rimportance 

15 des differents domaines fonctionnels de WT1 dans la progression tumorale. 
Ce meme phenomene de modification des rapports entre differentes formes 
d'ARN messagers et d'isoformes proteiques lors de la transformation 
cellulaire est retrouve pour la neurofibrine NF1. En outre, cette notion de 
modulation des phenomenes d'epissage qui signe la progression tumorale 

20 est soutenue egalement par I'exemple de HDM2 dont 5 epissages altematifs 
sont detectes dans les carcinomes ovariens et pancreatiques et dont les 
expressions augmentent selon le stade d'avancement tumoral. D'autre part, 
dans les cancers de la tete et du cou, Tun des mecanismes deactivation de 
p53 implique une mutation dans un site consensus d'epissage. 

25 Ces quelques exernples listes illustrent tout I'interet des 

techniques de ('invention basees sur la recherche systematique des 
variations d'epissage qui distinguent une tumeur donnee du tissu sain voisin. 
Les resultats qui en decoulent permettent en effet non seulement ia 
caracterisation de genes suppresseurs de tumeurs deja connus mais 

30 egalement, compte tenu de Taspect original et systematique des techniques 
de criblage differentiel qualitatif, I'identification de nouvelles variations 
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d'epissages specifiques de tumeurs affectant vraisemblablement de 
nouveaux genes suppresseurs de tumeurs. 

L'invention a done egalement pour objet un proc6de 
d'identification et/ou de clonage de genes suppresseurs de tumeurs ou 
5 d'alterations genetiques (e.g., d'epissages) au sein de genes suppresseurs 
de tumeurs, tel que defini ci-avant. Ce procede peut avantageusement 
comprendre les etapes suivantes : 

(a) Phybridation des ARN messagers d'un echantillon de tumeur 
avec les ADNc d'un echantillon sain, ou Pinverse, ou les deux en parallele, 
o (b) Pidentification, dans les hybrides formes, des regions 

specifiques de Pechantillon tumoral par rapport a Petat sain, 

(c) Pidentification et/ou le clonage de la proteine ou domaine 
proteique correspondant a une ou plusieurs regions identifies en (b). 

Les proprietes suppresseur de tumeur des proteines ou 
5 domaines identifies peuvent ensuite etre testees dans differents modeles 
connus. Ces proteines, ou leur forme native (possedant Pepissage observe 
dans le tissu sain), peuvent ensuite etre utilisees dans des applications 
therapeutiques ou diagnostiques, notamment en therapie genique 
antitumorale. 

3 La presente demande a done egalement pour objet non 

seulement les differents aspects de mise en oeuvre de la technologie mais 
aussi ('exploitation des informations qui en decoulent a des fins de 
recherche, de developpement de criblage de petites molecules chimiques, de 
developpement d'outils de therapie genique ou de diagnostic. 

5 A ce titre, Pinvention concerne egalement Putilisation des 

methodes, acides nucleiques ou banques decrits ci-dessus en 
genotoxicologie, c ! est-a-dire pour anticiper (predire) le potentiel toxique de 
composes tests. 

Les programmes genetiques engages lors du traitement de 

) cellules ou de tissus par des agents toxiques sont en grande partie correles 
aux phenomenes d'apoptose ou mort cellulaire programmee. Llmportance 
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des phenomenes d'epissage alternatif dans la regulation de ces voies 
apoptotiques est bien illustree par la litterature. Cependant, aucune 
technologie genomique decrite jusqu'a present ne permettait de rechercher 
systematiquement et d'isoler de maniere exhaustive les variations de 
5 sequences dues a des epissages alternatifs et distinguant deux situations 
physiopathoiogiques donnees. Les techniques de criblage differentiel 
qualitatif developpees dans la presente invention permettent de regrouper 
I'ensemble des differences d'epissage qui existent entre deux situations dans 
des banques d'ADNc. La comparaison des sequences d'ARN (par exemple 

lo les ARN messagers) d'un tissu (ou d'une culture cellulaire) traite ou non avec 
un compose toxique de reference permet d'etablir des banques d'ADNc qui 
regroupent les differences qualitatives de I'expression genique qui 
caracterisent Taction toxique etudiee. Ces banques d'ADNc peuvent ensuite 
etre hydridees avec des sondes derivees d'ARN extrait des memes tissus ou 

is cellules traites avec un produit chimique dont on veut evaluer le potentiel 
toxique. La plus ou moins grande capacite de ces sondes a s'hybrider avec 
les informations genetiques specifiques d'une situation toxique de reference 
permet de lui assigner un potentiel toxique. Par ailleurs, outre I'application de 
DATAS a la generation et Putilisation de banques de differences qualitatives 

20 induites par des agents toxiques, une partie de Tinvention consiste 
egalement a demontrer que des deregulations dans Tepissage de certains 
ARNs messagers peuvent etre induites par certains agents toxiques, a des 
doses inferieures aux IC50 mesurees dans des tests de cytotoxicite et 
d'apoptose connus de Thomme de I'art. De telles deregulations (ou 

25 dysregulations) peuvent etre utilisees comme marqueurs pour le suivi de la 
toxicite et/ou de I'efficacite de molecules (chimiques ou genetiques). 

L'invention concerne done egalement toute methode de 
detection ou de suivi du potentiel toxique et/ou therapeutique d'un compose 
basee sur la detection de formes et/ou de profils d^pissages induits par ce 

30 compose sur un echantillon biologique. Elle concerne en outre Tutilisation de 
toute modification de formes et/ou de profils d'epissages comme marqueur 
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pour le suivi de la toxicite et/ou de I'efficacite de molecules. 

devaluation ou le suivi. du potentiel toxique peut s'effectuer plus 
particulierement selon deux approches : 

Selon la premiere approche, le criblage differentiel qualitatif 
peut etre realise entre Lin tissu ou une culture cellulaire de reference, d'une 
part non traite et d'autre part traite par le produit dont on veut evaluer la 
toxicite. L'analyse des clones qui represented les differences qualitatives 
specifiquement induites par le produit permet ensuite eventuellement de 
detecter dans ces clones des evenements caracteristiques d'ADNc impliques 
dans les phenomenes lies a la toxicite comme I'apoptose. 

L'apparition de ces marqueurs est suivie selon la dose et la 
duree du traitement par le produit et permet une approche de son profil 
toxicologique. 

La presente demande a done egalement pour objet un procede 
d'identification, par criblage differentiel qualitatif selon les techniques 
presentees ci-dessus, de marqueurs de toxicite induits dans un systeme 
biologique modele par un compose chimique dont on veut tester le potentiel 
toxique. A cet egard, Tinvention concerne notamment un procede 
d'identification et/ou de clonage decides nucleiques specifiques d ! un etat 
toxique d'un echantillon biologique donne comprenant la preparation de 
banques differentielles qualitatives entre les ADNc et les ARN de I'echantillon 
apres ou sans traitement par un compose toxique test, et la recherche de 
marqueurs de toxicite specifiques des qualites de TSchantillon apres 
traitement. 

Selon la deuxieme approche, des abaques pour differentes 
classes de produits toxiques rassemblent leur profil de toxicite selon les 
doses employees et selon les durees des traitements pour un tissu ou un 
modele cellulaire de reference. A chaque point de ces abaques, des 
banques d'ADNc caracteristiques des differences genetiques qualitatives 
peuvent etre etablies. Ces banques sont des banques differentielles 
qualitatives, i.e., elles sont obtenues par extraction des informations 
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genetiques du. point choisi dans Ies abaques et du point correspondant au 
modele tissulaire ou cellulaire controle. Comme cela est illustre dans Ies 
exemples, le criblage differentiel qualitatif repose sur ['hybridation d'ARNm 
extraits d'une situation avec Ies ADNc issues d'une autre. Comme indique 
5 plus haut, le criblage differentiel qualitatif peut etre egalement mene a partir 
d'ARN totaux ou d'ARN nucleates contenant Ies premessagers. 

A cet egard, ('invention concerne un precede de determination 
ou devaluation de la toxicite d'un compose test sur un echantillon biologique 
donne comprenant ('hybridation : 
10 - de banques differentielles entre Ies ADNc et Ies ARN dudit 

echantillon biologique a I'etat sain et a un ou differents stades de toxicite 
resultant d'un traitement dudit echantillon avec un compose toxique de 
reference, avec, 

- une preparation d'acides nucleiques de Techantillon biologique 
15 traite par led it compose test, et 

- revaluation du potentiel toxique du compose test par analyse 
du degre d^ybridation avec Ies differentes banques. 

Selon ce precede, pour chaque situation (doses de compose et/ou 
temps dlncubation), deux hybridations reciproques sont avantageusement 
20 realisees, entre : 

- Ies ARN de la situation A (test) et Ies ADNc de la 
situation B (reference) ( rA/cB) 

- Ies ARN de la situation B (reference) et Ies ADNc de la 
situation A (test) (rB/cA). 

25 A chaque situation toxique de reference, a chaque point des 

abaques, correspondent done deux banques de criblage differentiel qualitatif. 
L'une de ces banques regroupe Ies variations qualitatives, c f est a dire 
notamment Ies epissages alternatifs, specifiques de la situation normale de 
reference alors que I'autre banque rassemble Ies epissages specifiques des 

30 evenements toxiques. Ces banques sont repliquees sur des supports solides 
tels des filtres de nylon ou de nitrocellulose ou avantageusement sur des 
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chips. Ces banques formees initialement par des fragments d f ADNc de 
longueur variable (selon les evenements d'epissages concernes) peuvent 
etre optimisees par remploi d'oligonucleotides derives des sequences isolees 
initialement. 

5 Lorsqu'un compose chimique est propose pour un 

developpement pharmaceutique, il peut etre applique sur les memes 
modeles tissulaires ou cellulaires que ceux repertories dans les abaques de 
toxicite. Des sondes moleculaires peuvent ensuite etre realisees a partir 
d'ARNm extraits des echantillons biologiques traites par le compose 

10 chimique d'interet Ces sondes sont ensuite hybridees a des filtres portant 
I'ADNc des banques rA/cB et rB/cA. Par exemple, la banque rA/cB peut 
contenir les sequences speciftquement presentes dans la situation normale 
et la banque rB/cA les elements d'epissage alternatifs specifiques de la 
situation de toxicite. L'innocuite ou la toxicite du compose chimique est alors 

15 aisement evaluee en fonction des profils d'hybridation d'une sonde derivee 
d'ARNm extraits du modele tissulaire ou cellulaire de reference traite par le 
compose teste: 

- une hybridation efficace avec la banque rA/cB et aucun 
signal sur la banque rB/cA revele une absence de toxicite du compose sur le 

20 modele etudie 

- Thybridation de la sonde avec des clones de la banque 
rB/cA indique une toxicite induite par le compose teste. 

Des exemples duplication de constitutions de telles banques 
peuvent etre fournis par des modeles de culture d'hepatocytes, telle la lignee 
25 HepG2, de cellules epitheliales renales, telle la lignee HK-2, ou de cellules 
endotheliales, telle la lignee ECV304, traites par des agents toxiques tei 
Tethanol, la camptothecine ou le PMA. 

Un exemple de choix peut egalement etre fourni par Tutilisation 
en cosmetologie de modeles de culture de peau traites ou non par des 
30 agents toxiques ou irritants. 

La presente demande a done egalement pour objet des 
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banques de criblage differentiel (entre les ADNc et les ARN), realisees a 
partir d'organes, de tissus ou de cultures cellulaires de reference traites avec 
des composes chimiques representatifs de grandes classes d'agents 
toxiques selon les abaques decrites dans la litterature. ^invention concerne 
5 aussi I'etalement de ces banques sur des filtres ou sur des supports connus 
de Phomme de Tart (nitrocellulose, nylon...). Avantageusement ces supports 
peuvent etre des chips ou puces qui defmissent ainsi des puces de 
genotoxicite. L'invention concerne en outre Texploitation qui peut etre faite du 
sequengage des differents clones qui constituent ces banques dans le but 

10 d'elucider les mecanismes mis en jeu par Taction des differents toxiques, 
ainsi que 1'utilisation de ces banques pour les hybrider avec des sondes 
provenant de cellules ou de tissus traites par un compost chimique ou un 
produit pharmaceutique dont on veut evaluer la toxicite. Avantageusement, 
invention concerne des banques d'acides nucleiques telles que definies ci- 

15 avant, preparees a partir de cellules de la peau traitees en differentes 
conditions toxiques. L'invention concerne en outre un kit comprenant ces 
differentes banques differentielles de la peau. 

L'invention concerne egalement Putilisation des methodes, 
acides nucleiques ou banques decrits ci-dessus pour evaluer (predire) ou 

20 ameliorer le potentiel therapeutique de composes tests 
(genopharmacologie). 

Dans cette utilisation, le principe mis en application est tres 
proche de celui decrit precedemment. Des banques differentielles de 
reference sont etablies entre les ADNc et les ARN d'une culture cellulaire ou 

25 d f un organe dans une situation controle et de leur equivalent mimant un 
modele de pathologie. L'efficacite therapeutique d f un produit peut alors etre 
evaluee en suivant sa capacite a antagoniser les variations qualitatives de 
Texpression genique qui sont specifiques du modele pathologique. Cela est 
mis en Evidence par la modification du profit d'hybridation d'une sonde issue 

30 du modele pathologique sur les banques de references: sans traitement, la 
sonde n'hybride qu'avec la banque qui contient les signatures specifiques de 
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la maladie. Apres traitement avec un produit efficace, la sonde bien que 
provenant du modele pathologique hybride preferentiellement avec I'autre 
banque, qui porte les signatures du modele equivalent sain. 

A cet egard, Invention concerne egalement un procede de 
5 determination ou devaluation de I'efficacite therapeutique d'un compose test 
sur un echantillon biologique donne comprenant Phybridation : 

- de banques differehtielles entre les ADNc et les ARN dudit 
echantillon biologique a Petat sain et a (differents stades de developpement 
de) Petat pathologique avec, 

10 - une preparation d'acides nucleiques de Pechantillon biologique 

traite par ledit compose test, et 

- revaluation du potentiel therapeutique du compose test par 
analyse du degre d'hybridation avec les differentes banques. 

Un exemple d'une telle application peut etre fourni par un 

15 modele d'apoptose mimant certains aspects de la neurodegenerescence qui 
sont antagonises par des facteurs trophiques de reference. Ainsi les cellules 
derivees de pheochromocytomes PC 12 differenciees en corps neuronaux en 
presence de NGF entrent en apoptose par retrait de ce facteur de 
croissance. Cette apoptose est accompagnee par expression de nombreux 

20 marqueurs de mort cellulaire programmee dont plusieurs sont regules par 
epissage altematif et dont I'apparition est inhibee par action d'IGFI. Deux 
banques issues de criblage differentiel qualitatif sont etablies a partir 
d'ARNm extraits de cellules PC12 differenciees entrees en apoptose par 
retrait de NGF d'une part et a partir de PC12 differenciees sauvegardees de 

25 Tapoptose par ajout d'IGFI d'autre part. Sur ces banques peuvent etre 
hybridees des sondes realisees a partir d'ARNm extraits de PC12 
differenciees entrees en apoptose et dont la survie est amelioree par 
traitement avec un produit neuroprotecteur a tester. L'efficacite de Tinversion 
des caracteristiques qualitatives induites par le compose test peut done etre 

30 appreciee par la capacite de la sonde a hybrider specifiquement les clones 
specifiques de la banque representative des cellules dont la survie est 
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amelioree. Ce test peut par ia suite etre utilise pour tester Tefficacite de 
derives du compose ou de tout autre nouvelle famille de composes 
neuroprotecteurs et en ameliorer le profil pharmacologique. 

Dans un mode de realisation particulier, le procede de 
5 Tinvention permet d'evaluer Tefficacite d'une compose test neuroprotecteur 
par hybridation avec une banque differentielle selon Tinvention entre une 
cellule nerveuse saine et cette cellule presentant un modele de 
neurodegenerescence. 

Dans un autre mode, il s'agit de tester un compose anti-tumoral 
10 sur des banques differentielles etablies a partir d'un echantillon de cellules 
tumorales et un echantillon sain. 

Comma indique ci-avant ? le procede de Tinvention peut en outre 
etre utilise pour ameliorer les proprietes d'un compose, en testant differents 
derives pour leur capacite a induire un profil d'hybridation proche de la 
is banque representative de Pechantillon sain. 

^invention concerne egalement I'utilisation des methodes, 
acides nucleiques ou banques decrits ci-dessus en pharmacogenomique, 
i.e., pour evaluer (predire) la reponse d f un patient a un compose ou 
traiternent test. 

20 La pharmacogenomique a pour ambition d'etablir des profils 

genetiques de patients afin de determiner quel traiternent est susceptible 
d'etre couronne de succes pour une pathologie donnee. Les techniques 
decrites dans la presente invention permettent a cet egard d'etablir des 
banques d'ADNc representatives des differences qualitatives qui existent 

25 entre une situation pathologique qui repond a un traiternent donne et une 
autre qui repond peu ou mal, susceptible d'etre Tobjet d'une autre strategie 
therapeutique. Ces banques de references etablies, elles peuvent etre 
hybridees avec des sondes realisees a partir d'ARN messagers de patients. 
Les resultats d'hybridation permettent de savoir quel patient a un profil 

30 d'hybridation correspondant a la situation de repondeur ou de non repondeur 
et ainsi d'affiner le choix de traiternent. 
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Dans cette application, le but est d'une part de proposer en 
fonction du patient le traitement le plus approprte, le plus susceptible d'etre 
couronne de succes et d'autre part d'enroler dans un traitement les patients 
les plus susceptibles d'y repondre avec succes. Comme dans les autres 

5 applications, deux banques de criblage differentiel qualitatif sont realisees: 
Tune a partir d'un modele ou d'un echantillon pathologique connu pour 
repondre a un traitement, I'autre a partir d'un autre modele ou echantillon 
pathologique qui repond peu ou mal a Taction therapeutique. Ces deux 
banques sont ensuite hybridees avec des sondes provenant d'ARNm extraits 

10 de biopsies de differents patients. Selon que ces sondes hybrident 
preferentiellement avec les epissages alternatifs specifiques de Tune ou 
I'autre situation, les patients peuvent etre repartis en repondeurs et en non 
repondeurs au traitement de reference qui a defini les modeles de depart. 

A cet egard, I'invention concerne egalement un procede de 

15 determination ou devaluation de la reponse d'un patient a un compose ou 
traitement test comprenant I'hybridation : 

- de banques differentielles entre les ADNc et les ARN d'un 
echantillon biologique repondeur audit compose/traitement et d'un 
echantillon biologique non-repondeur ou mal-repondeur audit 

20 compose/traitement, avec, 

- une preparation d'acides nucleiques d'un echantillon 
biologique pathologique du patient, et 

- revaluation du potentiel repondeur du patient par analyse du 
degre d'hybridation avec les differentes banques. 

25 Un exemple de choix de I'apport du criblage differentiel qualitatif 

a la pharmacogenomique est constitue par un criblage differentiel qualitatif 
entre deux tumeurs de meme origine histologique, Tune regressant lors du 
traitement par un compose antitumoral (par exemple un transfert d'un ADNc 
codant pour la proteine p53 sauvage par therapie genique), I'autre se 

30 montrant refractaire a ce traitement. La premiere retombee de la constitution 
de banques de differences qualitatives entre ces deux situations est de 
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determiner, par analyse des clones qui constituent ces banques, quels 
mecanismes moleculaires sont mobilises lors de la regression du premier 
modele et ne sont pas presents dans le deuxieme. 

Ensuite, ('utilisation de filtres ou tout autre support presentant les 
5 ADNc de ces banques permet de realiser des hybridations avec des sondes 
derivees d'ARNm de biopsies de tumeurs dont on veut anticiper la reponse 
audit traitement. Ces resultats permettent ainsi de proposer un enrolement 
optimise des patients dans un protocole clinique. 

Un exemple particulier de ce precede. consiste a determiner la 

10 reponse de tumeurs a un traitement par le gene suppresseur de tumeur p53. 
II a en effet ete decrit que certains patients et certaines tumeurs repondent 
plus ou moins bien a ce type de traitement (Roth et al. f Nature Medicine, 2 
(1995) 958). II est done important de pouvoir determiner quels types de 
tumeurs et/ou quels patients sont sensibles a un traitement par therapie 

15 genique par p53 sauvage, afin d'optimiser le traitement et de favoriser 
I'enrolement des patients dans les essais cliniques en cours. Le procede de 
Tinvention permet avantageusement de faciliter ces etapes en proposant des 
banques specifiques des qualites de cellules repondeuses et de cellules non 
repondeuses a p53. Des exemples de modeles cellulaires p53-sensibles ou 

20 resistants sont decrits par exemple par Sabbatini et al. (Genes Dev. 9 (1995) 
2184) ou par Roemer et al. (Oncogene 12 (1996) 2069). L'hybridation de ces 
banques avec des sondes derivees de biopsies de patients permet aisement 
d'evaluer leur potentiel repondeur. En outre les banques specifiques 
permettent egalement d'identifier des acides nucleiques impliques dans la 

25 reponse a p53. 

La presente demande concerne done egalement 
I'etablissement de banques de criblage differentiel a partir d'echantillons 
pathologiques, ou de modeles de pathologie, qui repondent differemment a 
au moins un agent pharmacoiogique. Ces banques peuvent etre des 

30 banques restreintes, complexes ou autologues comme definies ci-dessus. 
Elle concerne aussi Tetalement de ces banques sur des filtres ou sur des 
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supports connus de I'homme de Tart (nitrocellulose, nylon...). 
Avantageusement ces supports peuvent etre des chips ou puces qui 
definissent ainsi des puces de pharmacogenomique. L'invention porte encore 
sur I'exploitation qui peut etre faite du sequengage des differents clones qui 
5 constituent ces banques dans le but d'elucider les mecanismes qui president 
aux differences de reponses d'echantillons pathologiques a differents 
traitement, ainsi que ('utilisation de ces banques pour les hybrider avec des 
sondes provenant de biopsies provenant de situations pathologiques dont on 
veut anticiper la reponse au traitement de reference qui definit les banques. 

10 La presente invention decrit ainsi que des variations dans les 

formes et/ou profils d'epissages constituent des sources de marqueurs de 
pharmacogenomique, c'est-a-dire des sources de marqueurs permettant la 
mise en evidence de la capacite et de la maniere d'un patient a repondre a 
des traitements. A cet egard, l'invention a done egalement pour objet 

15 I'utilisation de I'intervariabilite, entre individus, des isoformes generees par 
epissage alternatif (analyse du spliceome) comme source de marqueurs de 
pharmacogenomique. L'invention concerne aussi 1'utilisation de modifications 
d'epissage induites par des traitements comme source de marqueurs de 
pharmacogenomique. Ainsi, comme explique ci-avant, les methodologies 

20 DATAS de invention permettent de generer des acides nucleiques 
. representatifs des differences qualitatives entre deux echantillons 
biologiques. Ces acides nucleiques, ou des formes derivees (sondes, 
amorces, acides complementaires, etc.) peuvent etre utilises pour Tanalyse 
du spliceome de sujets, en vue de mettre en evidence leur capacite/maniere 

25 de repondre a des traitements, ou leur predisposition a tel 
traitement/pathologie, etc. 

Ces differents exemples generaux illustrent Tinteret des 
banques de criblage differentiel qualitatif dans des etudes de genotoxicite, 
30 genopharmacologie, pharmacogenomique ainsi que dans des recherches de 
cibles d'interet diagnostique ou therapeutique. Ces banques sont issues du 
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clonage des differences qualitatives qui existent entre deux situations 
physiopathologiques. Puisqu'une autre utilisation des ADNc representatifs de 
ces differences qualitatives est de constituer des sondes destinees a cribler 
une banque d'ADN genomique dont les caracteristiques ont 6te decrites ci 
5 avant, une telle approche peut etre egalement mise en oeuvre pour toute 
etude de genotoxicite, genopharmacologie et pharmacogenomique ainsi que 
d'identification de gene. Dans les etudes de genotoxicite par exemple, les 
clones genomiques restraints par la taille de leurs insertions statistiquement 
a un seul intron ou a un seul exon sont classes sur des filtres en fonction de 

10 leur hybridation avec des sondes DATAS provenant de I'analyse differentielle 
qualitative entre une population cellulaire ou un tissu de reference et les 
memes cellules ou tissu traites par un compose toxique de reference. Ces 
clones representatifs des differentes classes de toxicite etant selectionnes, il 
peut ensuite etre precede a une hybridation de ces clones avec une sonde 

15 derivee des ARN messagers totaux d'une meme population cellulaire ou d'un 
meme tissu traite par un compose dont on veut apprecier le potentiel toxique. 

D'autres avantages et applications de la presente invention 
apparaTtront a la lecture des exemples qui suivent, qui doivent etre 
consideres comme illustratifs et non limitatifs. Les champs duplication de 

20 ('invention sont representes sur la figure 7. 

IEQENDE PE S FIQURE3 

Figure 1. Representation schematique des criblages differentiels selon 
25 ('invention (figure 1A) utilisant une (figure 1B) ou deux (figure 1C) 
hybridations, et utilisation des acides nucl6iques (figure 1 D). 

Figure 2. Representation schematique decrivant I'obtention d'hybrides 
ARN/ADN permettant de caracteriser les sequences ARN simple brin, 
30 signatures specifiques de I'etat pathologique ou de T6tat sain. 
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Figure 3. Representation schematique decrivant un moyen permettant 
d'isoler et de caracteriser par sequen9age les sequences d'ARN simple brin 
specifiques d'une situation pathologique ou d'une situation saine. 



5 Figure 4. Representation schematique decrivant un autre moyen 

permettant de caracteriser par sequen9age tout ou une partie des ARNs 
simple brin specifiques d'une situation pathologique ou d'une situation saine. 

Figure 5. Representation schematique permettant d'isoler les produits 
10 d'epissages altematifs grace a des structures R-loop 

Figure 6. Representation schematique du criblage differentiel qualitatif 
par restriction de boucles (formation d'homoduplexes ADNcdb/ADNc et 
extractions des informations, Figure 6A) et description des informations 
15 obtenues (Figure 6B). 

Figure 7. Apports du criblage differentiel qualitatif aux differentes 
etapes de la recherche et du developpement pharmaceutique. 

20 Figure 8. Isolation d'un domaine differentiellement episse dans le 

modele grb2/grb33. A) Production des ARNs synthetiques de grb2 et de 
grb33. B) Suivi des premieres etapes de DATAS conduisant a la 
caracterisation d'un fragment ARN correspondant au domaine 
differentiellement episse ; 1 : ARN de grb2, 2 : Hybridation entre I'ARN de 

25 grb2 et I'ADNc de grb33, 3 : Hybridation entre I'ARN de grb2 et I'ADNc de 
grb2, 4 : Hybridation entre I'ARN de grb2 et de I'eau, 5 : Surnageant apres 
passage sur billes Streptavidine de (2), 6 : Surnageant apres passage sur 
billes Streptavidine de (3), 7: Surnageant apres passage sur billes 
Streptavidine de (4), 8 : Digestion du duplex ARN grb2 / ADNc grb33 a la 

30 Rnase H, 9 : Digestion du duplex ARN grb2 / ADNc grb2 a la Rnase H, 10 : 
Digestion de I'ARN grb2 a la Rnase H, 11 : pareil que (8) apres passage sur 
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colomne d'exclusion, 12 : pareil que (9) apres passage sur colomne 
d'exclusion, 13 : pareil que (10) apres passage sur colomne d'exclusion. 

Figure 9 . Representation des populations d'ARNs non appariees 
5 issues de la digestion par la Rnase H a partir de duplexes ARN / ADNc 
simple brin provenant de cellules HepG2 traitees ou non a I'ethanol. 

Figure 10 . Representation des populations d'ADNc double brin 
generees par une des variantes de DATAS. 1 a 12: PCRs a partir de 
10 populations de boucles d'ARNs issues de la digestion a la Rnase H, 13 : 
PCR a partir d'ADNc total. 

Figure 11. Application de la variante de DATAS faisant intervenir les 
ADNc double brin sur le modele grb2/grb33. A) Analyse sur gel d'agarose 

15 des complexes apres hybridation : 1 : ADNc double brin grb2 / ARN grb33, 
2 : ADNc double brin grb2 /ARN grb2, 3 : ADNc double brin grb2 / eau. B) 
Digestion des echantillons 1,2 et 3 de A) par la nuclease S1 et la nuclease 
" Mung Bean " : 1 a 3 : complexes 1 a 3 avant traitement au glyoxal ; 4 a 6 : 
complexes 1 a 3 apres traitement au glyoxal ; 7 a 9 : Digestions de 1 a 3 par 

20 nuclease S1 ; 10 a 12 : Digestions de 1 a 3 par nuclease Mung Bean. 

Figure 12. Application de la variante de DATAS faisant intervenir les 
ADNc simple brin et la Rnase H sur un systeme de cellules HepG2 traitees 
ou non a I'ethanol 0,1M pendant 18 heures. Les inserts clones ont ete 
25 transferes sur membrane apres electrophorese sur gel d'agarose et soumis a 
hybridation a I'aide de sondes correspondant aux situations traitees (Tr) ou 
non (NT). 

Figure 13. Mode operatoire pour evaluer le potentiel toxique d'un 
30 produit. 
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Figure 14. Mode operatoire pour suivre I'efficacite d'un produit. 

Figure 15. Mode operatoire pour etudier la susceptibilite d'une 
situation pathologique a un traitement. 

5 

Figure 16. Analyse d'hybridation differentielle de clones issus de 
DAT AS a partir d'ARNs extraits de cellules induites et d'ADNc extraits de 
cellules non induites. A) Utilisation de colonies bacteriennes deposees et 
lysees sur membrane. B) Southern Blot effectue a partir d'une selection de 
10 clones de A. 

Figure 17. Sequences nucleotidique et peptidique de ASHC (SEQ ID 
NO: 9 et 10). 

is Figure 18. Tests de cytotoxicity et d'apoptose sur cellules HepG2 

traitees A) a I'ethanol ; B) a la camptothecine ; C) au PMA. 

Figure 19. Reactions de RT-PCR effectuees a partir d'ARNs extraits 
de cellules HepG2 traitees ou non (NT) par I'ethanol (Eth.), la camptothecine 
20 (Camp.) et le PMA (PMA) permettant ('amplification de fragments 
correspondants a des domaines de MACH-a, BCL-X, FASR et beta-actine 
comme controle de normalisation. 

Dans les exemples et la description de I'invention, il est fait references 
25 aux sequences de la Liste de Sequences, qui contient le texte libre suivant: 

<223> OLIGO 

<223> OLIGO 

<223> OLIGO 

<223> OLIGO 
30 <223> OLIGO 

<223> OLIGO 
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<223> OLIGO 
<223> OLIGO 
<223> OLIGO 
<223> OLIGO 
5 <223> OLIGO 

<223> OLIGO 

EXEMPLES 

10 1. CLONAGE DIFFERENTIEL DES EPISSAGES ALTERNATIFS ET 

AUTRES MODIFICATIONS QUALITATIVES DES ARNS EN UTILISANT 
DES ADNc SIMPLE-BRINS 

Les ARN messagers correspondant a deux situations, I'une normale 
15 (mN) et I'autre pathologique (mP), sont isoles a partir de biopsies ou de 
cellules en culture. Ces ARN messagers sont convertis en ADN 
complementaires (cN) et (cP) a I'aide de reverse transcriptase (RT). Des 
hybrides mN/cP et cN/mP sont ensuite realises en phase liquide (se reporter 
au schema de la figure 2 illustrant un des deux cas aboutissant a la 
20 formation de cN/mP). 

Ces hybrides sont avantageusement realises en emulsion phenolique 
(technique PERT ou Phenol Emulsion DNA Reassociation Technique) 
maintenue par thermocycles (Miller, R.,D. and Riblet, R., 1995, Nucleic Acids 
Research, vol 23, n°12, pp 2339-2340). Typiquement, cette etape 
25 d'hybridation est realisee entre 0,1 a 1 ug d'ARN polyA+ et 0,1 a 2\ig d'ADN 
complementaire dans une emulsion formee d'une phase aqueuse (tampon 
phosphate de sodium 120mM, NaCI 2.5M, EDTA 10mM) et d'une phase 
organique representant 8% de la phase aqueuse et constitute de phenol 
bidistille. 

30 Une autre technique est egalement avantageusement 

employee de facon a obtenir des heteroduplex : a Tissue de la transcription 
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inverse, I'ADNc neosynthetise est separe de Tamorce oligodT biotinylee sur 
colonne d'exclusion. 0,1 & 2^ig de cet ADNc est coprecipite avec 0,1 a 1jag 
d'ARN polyA+ en presence de 0 f 3M d'acetate de sodium et de deux volumes 
d'ethanol. Ces acides nucleiques coprecipites sont repris dans 30|il d'un 
5 tampon d'hybridation qui contient 80% de formamide, 40mM de PIPES 
(piperazinebis(2-ethanesulfonic acid)) ph6,4, 0,4M de NaCI et 1mM d'EDTA. 

Les acides nucleiques en solution sont denatures par chauffage 
10mn a 85°C puis leur hybridation est realisee pendant au moins 16h et 
jusqu'a 48h a40°C. 

10 L'interet de la technique d'hybridation en formamide est de 

permettre des conditions de plus forte selectivity lors de Tappariement des 
brins d'ADNc et d'ARN. 

A Tissue de chacune de ces deux techniques d'hybridation, 
nous disposons d'heteroduplex ARN/ADN dont la perfection d'appariement 

is depend de Tefficacite de la RT a synthetiser la longueur totale des ADNc. 
Demeurent egalement sous forme de simples brins les regions d'ARN (et 
d'ADN) qui correspondent aux epissages alternatifs qui differencient les deux 
etats physiopathologiques etudies. 

Le but de la methode est ensuite de caracteriser rinformation 

20 genetique portee par ces boucles d'epissage. 

Pour cela, les heteroduplex sont purifies par capture des ADNc 
(amorces avec des oligodT biotinyles) grace a des billes portant des 
groupements streptavidines. Avantageusement ces billes sont de billes 
douees de proprietes magnetiques, ce qui permet de les separer des ARN 

25 non engages dans les heteroduplex par action d'un separateur magnetique. 
De telles billes et de tels separateurs sont disponibles commercialement. 

Sont isoles a ce stade de la procedure les heteroduplex et les 
ADNc non engages dans des hybridations avec des ARN. Ce materiel est 
ensuite soumis a Taction de la RNaseH qui va specifiquement hydrolyser les 

30 regions d'ARN hybridees avec les ADNc. Les produits resultant de cette 
hydrolyse sont d'une part les ADNc et d'autre part les fragments d'ARN qui 
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correspondent aux boucles d'epissage ou aux regions non hybridees du fait 
du rendement partiel de la transcriptase inverse. Les fragments d'ARN sont 
separes de I'ADN par separation magnetique selon le meme mode 
operatoire que celui mentionne plus haut et par digestion avec de la DNase 
5 exernpte de toute contamination par une activite Rnase. 

1,1. Validation de la te chnique DATAS sur les variants 
d'epissage du gene Grb2 

Une mise en evidence de la faisabilite de cette approche a ete 

10 realisee sur un systeme in-vitro utilisant un ARN correspondant a la region 
codante de Grb2 d'une part et un ADNc simple brin complementaire a la 
region codante de Grb3.3. Grb2 est un gene possedant une phase codante 
de 651 paires de bases. Grb33 est une isoforme de grb2 generee par 
epissage alternatif et comprenant une deletion de 121 paires de bases dans 

15 le domaine fonctionnel SH2 de grb2 (Fath et.al, Science (1994), 264, 971-4). 
Les ARNs de Grb2 et de Grb33 sont synthetises selon les techniques 
connues de I'homme du metier a partir d'un plasmide contenant la sequence 
codante de Grb2 ou de Grb33 sous controle du promoteur T7 a I'aide du kit 
RiboMax (Promega). L'analyse des produits demontre une synthase 

20 homogene (figure 8A). Dans un but de visualisation, TARN de Grb2 a 
egalement ete rendu radioactif par incorporation d'une base marquee lors de 
la transcription in-vitro a I'aide du kit RiboProbe (Promega). Les ADNc de 
Grb2 et de Grb3.3 ont ete synthetises par transcription inverse a partir des 
ARNs synthetiques produits ci-dessus, du kit Superscript II (Life 

25 Technologies) et d'une amorce oligonucleotidique biotinylee commune a 
Grb2 et a Grb33 correspondant au complementaire de la sequence (618- 
639) de Grb2. Les ARNs et ADNcs ont ete traites selon les indications des 
fournisseurs (promega, Life Technologies), purifies sur colonne d'exclusion 
(Rnase free sephadex G25 ou G50, 5 Prime, 3 Prime) et quantifies par 

30 spectrophotometrie. 

Les premieres etapes de DATAS ont ete appliquees en 
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associant, en suspension 1 0ng d'ARN marque de Grb2 avec : 

1 . 1 00 ng d'ADNc de grb33 biotinyle, 

2. 100 ng d'ADNc de grb2 biotinyle, 

3. de I'eau 

5 dans 30 ul d'un tampon d'hybridation qui contient 80% de formamide, 40 mM 
PIPES (pH 6,4), 0,4 M NaCI, 1 mM EDTA. Les acides nucleiques sont 
denatures par chauffage 10 mn a 85 °C, puis I'hybridation est realisee 
pendant 16 heures a 40°C. Apres capture a I'aide de billes streptavidine, les 
echantillons sont traites a la RNase H comme decrit precedemment. 

io L'analyse de ces etapes est realisee par electrophorese sur gel 

d'acrylamide a 6% suivi d'un traitement des gels a I'aide d'un Instant Imager 
(Packard Instruments) permettant la qualification et la quantification des 
especes issues de I'ARN de grb2 marque (figure 8B). Ainsi, les puits 2,3 et 4 
indiquent que les duplexes grb2/grb33 et grb2/grb2 se sont formes de facon 

is quantitative. La migration du complexe grb2/grb33 est retardee par rapport a 
celle de I'ARN de grt>2 (puits 2) alors que celle du complexe grb2/grb2 est 
augmentee (puits 3). Les puits 5,6 et 7 correspondent aux echantillons non 
retenus par les billes streptavidine d6montrant que 80% des complexes 
grb2/grb33 et grb2/grb2 ont ete retenus sur les billes alors que I'ARN de grb2 

20 seul, non biotinyle, se retrouve exclusivement dans le surnageant des billes. 
Le traitement a la Rnase H libere, outre les nucleotides libres qui migrent 
plus vite que le bleu de Bromophenol (BPB) une espece migrant en deca du 
bleu de xylene Cyanol (XC) (marque par une fleche sur la figure) et ce 
specifiquement dans le puits 8 correspondant au complexe grb2/grb33 par 

25 rapport aux puits 9 et 10 qui correspondent au complexe grb2/grb2 et a 
I'ARN de grb2. Les puits 1 1,12 et 13 correspondent aux puits 8,9 et 10 apres 
passage des echantillons sur une colomne d'exclusion pour 6liminer les 
nucleotides libres. La migration observee dans les puits 8 et 11 est celle 
attendue pour une molecule d'ARN correspondant a la deletion de 121 

30 nucleotides differencial grb2 de grb33. 

Ce resultat montre bien la possibility d'obtenir les boucles 
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d'ARN generees par la formation d'heteroduplex entre deux sequences 
derivees de deux isoformes d'epissage. 

1.2. Application de la tech nique DATAS a la g e neration de 
5 banaues qualitatives de cellules heoatiques da ns un etat sain et toxigue 

Une situation plus complexe a ete etudiee. Dans le cadre de 
I'application de la technologie DATAS comme outil predictif de toxicite de 
molecules, des cellules humaines de type hepatocytaire, HepG2, ont ete 
traitees par de I'ethanol 0,1 M pendant 18 heures. Les ARNs ont ete extraits 
10 a partir des cellules traitees ou non. La variante de DATAS decrite ci-dessus 
(preparation d'ADNc sb biotinyles, hybridations croisees en phase liquide, 
application d'un champs magnetique pour separer les especes, traitement 
RNaseH) a ete appliquee avec les cellules non traitees en situation de 
reference (ou situation A) et les cellules traitees en situation test (ou situation 
15 B) (figure 9). Les ARNs extraits n'etant pas marques radioactivement , la 
visualisation des populations d'ARN generees par digestion a la RnaseH est 
realisee en effectuant une reaction d'echange du phosphate en 5' des ARNs 
par un phosphate marque, a I'aide de polynucleotide kinase de T4 et de 
gamma-P 32 ATP. Ces marquages sont ensuite deposes sur un gel 
d'acrylamide/uree et analyses par exposition a I'aide d'un Instant Imager 
(Packard Instruments). Des signatures complexes issues des hybridations 
A/B et B/A peuvent alors etre visualisees avec un premier groupe de signaux 
migrant faiblement dans le gel et correspondant a des sequences d'acides 
nucleiques de taille importante et un deuxieme groupe de signaux migrant 
entre 25 et 500 nucleotides. Ces signatures sont d'intensite beaucoup plus 
faible a partir de la situation A/A suggerant que I'ethanol peut induire une 
reprogrammation de I'epissage des ARNs, traduite par I'existence de signaux 
en A/B et B/A. 

1.3. Clonaoe et Preparation de hang ues a partir des acides 
nucleinuRs identifies. 
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Piusieurs variantes experimentales sont ensuite envisageables 
pour doner ces fragments d'ARN resistant a 1'action de la Rnase H: 

A. Une premiere approche consiste a isoler ces boucles et a les 
5 doner (Figure 3). 

Selon cette approche, il est procede a une ligation 
d'oligonucleotides a chacune des extremites par action de la RNA ligase 
selon les conditions connues de Thomme de Tart. Ces oligonucleotides sont 
ensuite utilises comme amorces pour effectuer une RT PCR. Les produits de 
10 PCR sont clones et cribles avec des sondes d'ADN complementaires totales 
correspondant aux deux situations physiopathologiques d'interet. Seuls les 
clones hybridant preferentiellement avec une seule des deux sondes 
contiennent les boucles d'epissage qui sont ensuite sequencees et/ou 
utilisees pour generer des banques. 

15 

B. La seconde approche (Figure 4) consiste a effectuer une 
transcription inverse sur TARN simple brin libere des heteroduplex apres 
action de la RNaseH, initiee a I'aide d'amorces au moins en partie aleatoires. 
Ainsi, il peut s'agir d'amorces aleatoires en 3' et en 5\ d'amorces aleatoires 

20 en 3' et determinees en 5\ ou encore d'oligonucleotides semi-aleatoires, 
c'est-a-dire comprenant une zone de degen§rescence et une zone definie. 

Selon cette strategie, les amorces sont done susceptibles de 
s'hybrider soit n'importe ou sur TARN simple brin, soit a chaque succession 
de bases fixee par le choix de Tamorce semi-aleatoire. Une PCR avec des 

25 amorces correspondant aux oligonucleotides decrits ci-dessus permet 
ensuite d'obtenir des sequences derivees des boucles d'epissage. 

La figure 10 (puits 1 a 12) montre I'analyse sur gel d'acrylamide 
des fragments de PCR obtenus a partir de piusieurs essais DATAS et 
couplee a Tutilisation des oligonucleotides semi-aleatoires suivants: 

30 GAGAAGCGTTATNNNNNNNAGGT (SEQ ID NO: 1 , X=T) 
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G AG AAG CGTT ATN N N N N N NAG G A (SEQ ID NO: 1, X=A) 

GAGAAGCGTTATNNNNNNNAGGC (SEQ ID NO: 1, X=C) 
GAGAAGCGTTATNNNNNNNAGGG (SEQ ID NO: 1, X=G) 
La comparaison avec la complexity des signaux obtenus en 
5 utilisant les memes oligonucleotides, mais de I'ADNc total comme matrice 
(puits 13) demontre que DATAS a permis de filtrer ("profiler") des 
informations correspondant a des differences qualitatives. 

Cette variante a ete utilisee afin de doner un evenement 
correspondant au domaine ARN de grb2 genere par action de la Rnase H a 
10 partir du duplex ARN grt>2 / ADNc simple brin de grb33 selon le protocole 
decrit precedemment (exemple 1.1.). A cette fin, un oligonucleotide de 
sequence : GAGAAGCGTTATNNNNNNNNTCCC (SEQ ID NO: 2), choisi sur 
le modele GAG AAG C GTTATN N N N N N N WX YZ (dans lequel N est defini 
comme precedemment, W, X et Y represented chacun une base fixe 
15 determinee, et Z represente soit une base determinee soit un groupe 3'-OH, 
SEQ ID NO: 3) et selectionne pour amplifier un fragment dans la deletion de 
grb2 a ete utilise, permettant de generer un fragment PCR dont le clonage et 
le sequengage a demontre qu'il etait effectivement issu du domaine delate 
de grb2 (194-281 dans grb2). 

20 

Ces deux approches permettent done la production de 
compositions d'acides nucleiques representatifs des epissages differentiels 
dans les deux situations testees qui peuvent etre employees comme sondes 
ou pour construire des banques d'ADNc de differences qualitatives. La 
25 capacite de la technologie DATAS a generer des banques profilees d f ADNc 
representatives de differences qualitatives est egalement illustree par 
Texemple 1.4. suivant. 

1.4. Production de banques profilees representatives de 
30 cellules endothelials humaines 

Cet exemple a ete realise a partir d'une lignee de cellules 
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endothelials humaines (ECV304). L'analyse qualitative de ('expression 
genetique a ete realisee a partir d'ARN cytosoliques extraits de cellules en 
proliferation, d'une part, et de cellules en anoTkis (apoptose par privation de 
support d'attachement), d'autre part. 
5 Les cellules ECV ont ete cultivees en milieu 199 supplements 

en sels de Earle (Life Sciences). Leur mise en anoTkis a ete realisee par 
passage pendant 4 heures sur boTtes de culture traitees au polyHEMA. Lors 
de la preparation des ARN, les cellules ont ete lysees dans un tampon 
contenant du Nonidet P-40. Les noyaux sont ensuite ecartes par 

10 centrifugation. La solution d'extrait cytoplasmique a 6te ensuite ajustee de 
maniere a fixer de fa?on specifique TARN a la matrice de silice Rneasy selon 
les instructions de la societe Qiagen. Apres lavage, les ARN totaux sont 
elues dans de I'eau traitee au DEPC. Les ARNs messagers sont prepares a 
partir des ARNs totaux par separation sur billes magnetiques Dynabeads 

is oligo (dT) 25 (Dynal). Apres avoir mis en suspension les billes dans un 
tampon de fixation, TARN total est incube pendant 5 min a temperature 
ambiante. Apres separation magnetique et lavage, les billes sont reprises 
dans un tampon d'elution pour une incubation a 65°C qui libere les ARNs 
messagers. 

20 Les syntheses d'ADN premier brin sont effectuees a partir des 

ARNs messagers en utilisant la Reverse Transcriptase Superscript II ou 
TherrnoScript (Life Technologies) a I'aide d'amorces olido (dT). Apres 
RnaseH, les nucleotides libres sont elimines par passage sur colonne 
Sephadex G50 (5 Prime- 3 Prime). Apres extraction au phenol / 

25 Chloroforme et precipitation a I'ethanol, les echantillons sont quantifies par 
absorbance UV. 

Les quantites requises d'ARN et d'ADNc (en Toccurrence 
200ng de chaque) sont combinees et precipitees a I'ethanol. Les 
echantillons sont repris dans un volume de 30^1 dans un tampon 

30 d'hybridation (Hepes (pH 7.2) 40 mM, NaCI 400mM, EDTA 1mM) 
supplements de formamide desionisee (80% (v/v), sauf indication contraire). 
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Apres denaturation 5 min a 70°C, les echantillons sont incubes sur la nuit a 
40°C. 

Les billes Streptavidine (Dynal) sont lavees puis 
reconditionnees dans un tampon de fixation (2X= Tris-HCI (pH 7,5) 10 mM, 
5 NaCI 2M, EDTA 1 mM). Les echantillons d'hybridation sont amenes a un 
volume de 200 fil avec de I'eau puis ajustes a 200 \i\ de billes pour une 
incubation de 60 min a 30°C. Apres capture sur aimant et lavages des billes, 
celles-ci sont reprises dans 150 de tampon RnaseH puis incubees 
pendant 20 min a 37°C. Apres capture sur aimant, les regions non hybridees 

10 ont ete relarguees dans le surnageant qui est traite a la Dnase puis extrait 
au phenol acide / chloroforme puis precipite a Tethanol. Les precipitations a 
Tethanol de faibles quantities decides nucleiques sont effectuees a Taide 
d'un polymere commercial SeeDNA (Amersham Pharmacia Biotech) 
permettant de recuperer de fagon quantitative des acides nucleiques a partir 

15 de solutions tres diluees (de I'ordre du ng/ml). 

La synthese d'ADNc a partir des echantillons d'ARNs 
provenant de Taction de la RnaseH est effectuee a partir d'hexanucleotides 
aleatoires a Taide de Superscript II Reverse Transcriptase. L'ARN est 
ensuite degrade a Taide d'un melange de RnaseH et de Rnase T1. 

20 L'amorce, les nucleotides non incorpores et les enzymes sont separes de 
TADNc a Taide d'une cartouche " GlassMAX Spin \ L'ADNc correspondent 
aux boucles d'epissage est ensuite soumis a une reaction de PCR en 
utilisant des oligonucleotides de type semi-aleatoire deja decrits plus haut 
dans Tinvention. En Toccurrence les oligonucleotides choisis sont : 

25 GAGAAGCGTTATNNNNNCCA (SEQ ID NO: 4) 

La reaction de PCR est r6alisee a Taide de Taq Polymerase sur 30 
cycles : 

• D6naturation initiale : 94°C pdt 1 min. 

• 94°C pdt 30 s 
30 • 55°C pdt 30s 

• 72°C pdt 30s 
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• Extension finale : 72°C pdt 5 min. 

Les produits de PCR ont ete clones dans le vecteur pGEM-T 
(Promega) possedant un T flottant aux extremites 3* afin de faciliter le 
clonage de fragments issus de I'activite de la Taq Polymerase. Apres 

5 transformation dans les bacteries JM109 competentes (Promega), les 
colonies obtenues sont repiquees sur filtre de nitrocellulose, et hybridees 
avec des sondes derivees de produits de PCR effectuees sur des ADNc 
totaux des cellules en proliferation d'une part et en anoikis d'autre part. Pour 
ces PCR les memes oligonucleotides G AG AAG CGTTATN N N N N CCA sont 

10 utilises. Dans une premiere realisation experimental, 34 clones hybridant 
preferentiellement avec la sonde des cellules en apoptose et 13 clones 
hybridant preferentiellement avec la sonde des cellules en proliferation ont 
ete i soles. 

Parmi ces 13 clones, 3 clones contiennent le meme fragment 
15 d'ADNc qui derive du domaine SH2 de la proteine SHC. 

La sequence de ce fragment est la suivante : 
CCACACCTGGCCAGTATGTGCTCACTGGCTTGCAGAGTGGGCAG 
CCAGCCTAAGCATTTGCACTGG (SEQ ID NO: 5) 

L'utilisation d'amorces de PCR qui encadrent le domaine SH2 
20 de SHC (oligo5' : GGGACCTGTTTGACATGAAGCCC (SEQ ID NO:6) ; 
oligo3': CAGTTTCCGCTCCACAGGTTGC (SEQ ID NO:7)) a permis de 
caracteriser la deletion du domaine SH2 de SHC qui est observee 
specifiquement dans les cellules ECV en anoikis. Avec ce couple d'amorce, 
un seul produit d'amplification correspondant a un fragment d'ADNc de 382 
25 paires de bases qui contient le domaine SH2 integre est obtenu a partir 
d'ARN de cellules ECV en phase exponentielle. Un fragment additionnel de 
287 paires de bases est observe lorsque la PCR est realisee a partir d'ARN 
de cellules en anoikis. Ce fragment supplemental derive d'un ARN 
messager derive du messager de SHC mais presentant une deletion. 
30 La sequence de cette deletion est la suivante : 

GTACGGGAGAGCACGACCACACCTGGCCAGTATGTGCTCACTGG 
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CTTGCAGAGTGGGCAGCCTAAGCATTTGCTACTGGTGGACCCTGAGGG 
TGTG (SEQ ID NO: 8). 

Cette deletion correspond aux bases 1 1 98 a 1 293 de la phase 
ouverte du messager codant pour les formes de 52kDa et 46kDa de la 
5 proteine SHC (Pelicci, G. et al, 1992, Cell, 70, pp93-104). 

Les donnees structurales des domaines SH2 ainsi que la 
litterature indiquent qu'une telle deletion aboutit a la perte de I 'affinite pour 
les phosphotyrosines puisqu'elle englobe les acides amines impliques dans 
les interactions avec les tyrosine phosphorylees (Waksman, G. et al, 1992, 
10 Nature, vol358, pp646-653). Les proteines SHC 6tant des adapteurs qui 
connectent differents partenaires par leurs domaines SH2 et PTB 
(PhosphoTyrosine Binding domain), cette deletion genere done un dominant 
negatif naturel de SHC que nous appelons ASHC. Les domaines SH2 des 
proteines dont les genes sont sequences etant portes par deux exons, il est 
15 vraisemblable que la deletion identifiee par la methode DATAS correspond a 
un exon alternatif du gene SHC. 

Les sequences proteique et nucleique de ASHC sont les 
representees sur la Figure 17 (SEQ ID NO: 9 et 10). 

Le domaine SH2 de SHC etant implique dans la transduction 
20 de nombreux signaux impliques dans la proliferation et la viabilite cellulaires, 
Texamen de la sequence de ASHC permet d'anticiper ses proprietes de 
dominant negatif sur la proteine SHC et sa capacite d'interferer avec 
different signaux cellulaires. 

L'invention concerne egalement cette nouvelle forme epissee 
25 de SHC, le domaine proteique correspondant a Pepissage, tout anticorps ou 
sonde nucleique permettant sa detection dans un echantillon biologique, et 
leurs utilisation diagnostique ou therapeutique, par exemple. 

L'invention concerne en particulier tout variant de SHC comprenant au 
moins une deletion correspondant aux bases 1198 a. 1293, plus 
30 particulierement une deletion de la sequence SEQ ID NO: 8. L'invention 
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concerne plus specifiquement le variant ASHC ayant ia sequence SEQ ID 
NO: 9, code par la sequence SEQ ID NO: 10. 

L'invention concerne aussi toute sonde nucleique, oligonucleotide ou 
anticorps permettant d'identifier le variant ASHC ci-dessus, et/ou toute 
5 alteration du rapport SHC/ASHC dans un echantillon piologique. II peut s'agir 
notamment d'une sonde ou oligonucleotide complementaire de tout ou partie 
de la sequence SEQ ID NO: 8, ou d'un anticorps dirige contre le domaine 
proteique code par cette sequence. De telles sondes, oligonucleotides ou 
anticorps permettent de detecter la presence de la forme non epissee (e.g., 
10 SHC) dans un echantillon biologique. 

Les materiels peuvent en outre etre utilises en parallele avec des 
sondes, oligonucleotides et/ou anticorps specifiques de la forme epissee 
(e.g., ASHC), c'est-a-dire correspondant par exemple a ia region de jonction 
resultant de I'epissage (localisee autour du nucleotide 1198 de la sequence 
15 SEQ ID NO: 10). 

De tels materiels peuvent etre utilises pour le diagnostic de 
pathologies liees a une immunodepression (cancer, traitement 
immunosuppresseur, SI DA, etc.). 

L'invention concerne aussi tout procede de cribiage de molecules 
20 base sur le blocage (i) du domaine episse dans la proteine SHC (notamment 
pour induire un etat de tolerance immunitaire par exemple dans les maladies 
autoimmunes ou les rejets de greffes et les cancers) ou (ii) des gains de 
fonction acquis par la proteine ASHC. 

L'invention concerne en outre ['utilisation therapeutique de ASHC, et 
25 notamment pour le traitement de cellules cancereuses ou de cancers (ex 
vivo ou in vivo) dans lesquels une hyperphosphorylation de la proteine SHC 
peut etre mise en evidence, par exemple. A cet egard, l'invention concerne 
aussi tout vecteur, notamment viral, comprenant une sequence codant pour 
ASHC. II s'agit preferentiellement d'un vecteur capable de transfecter des 
30 cellules cancereuses ou en proliferation, telles que des cellules musculaires 



BNSDOCID: <WO 9946403A1J_> 



WO 99/46403 



PCT/FR99/00547 



lisses, des cellules endothelials (restenose), des fibroblastes (fibroses), de 
preference d'origine mammifere, notamment humaine. Comme vecteur viral, 
on peut citer notamment des vecteurs adenoviraux, retroviraux, AAV, herpes, 
etc. 

5 2. CLONAGE DIFF^RENTIEL DES EPISSAGES ALTERNATIFS ET 

AUTRES MODIFICATIONS QUALITATIVES DES ARNS EN UTILISANT 
DES ADNc DOUBLE-BRINS (FIGURE 5). 

Les ARNs messagers correspondents aux situations normales 

io (mN) et pathologiques (mP) sont produits, ainsi que les ADNs 
complementaires double brin correspondents (dsN et dsP) par des 
protocoles classiques de biologie moleculaire. Des structures de type "R- 
loop" sont alors obtenues en hybridant mN avec dsP et mP avec dsN dans 
une solution contenant 70% de formamide. Les domaines nucleiques 

is differentiellement episses entre la situation N et P resteront sous forme 
d'ADN double brin. Les simples brins d'ADN deplaces sont alors traites au 
glyoxal afin d'eviter le redeplacement du brin d'ARN lors du retrait de la 
formamide. Apres retrait de la formamide et du glyoxal puis traitement a la 
RNAseH, nous nous retrouvons avec des structures de type abeille, les 

20 ADNs simples brin non apparies representant les ailes de I'abeille et le 
domaine double brin appareille d'interet representant le corps de I'abeille. 
Utilisation d'enzymes qui degradent specifiquement I'ADN simple brin 
comme la nuclease S1 ou la Mung Bean nuclease permet I'isolation de I'ADN 
reste sous forme double brin qui est ensuite clone puis sequence. Cette 

25 deuxieme technique permet Tobtention directe d'une empreinte ADN double 
brin du domaine dlnteret comparativement au premier protocole qui produit 
une empreinte ARN de ce domaine. 

Cette approche a ete realisee sur le modele grb2/grb33 decrit 
precedemment. L'ADN double brin de grb2 a ete produit par amplification 

30 PCR a partir de TADNc simple brin de grb2 et de deux amorces 
nucleotidiques correspondant a la sequence (1-22) de grb2 et a la sequence 
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compiementaire de (618-639) de grb2. Ce fragment PCR a ete purifie sur 
gel d'agarose, nettoye sur colonne d'affinite (JetQuick, Genomed) et 
quantifie par spectrophotometrie. Dans le meme temps, deux ARNs 
synthetiques correspondant aux phases de lecture de grb2 et de grb33 ont 
ete produits a partir de vecteurs plasmidiques comportant les cDNAs de grb2 
ou de grb33 sous controle du promoteur T7, a I'aide du kit RiboMax 
(Promega). Les ARNs ont ete purifies selon les instructions du foumisseur et 
nettoyes sur colomne d'exclusion (Sephadex G50, 5 prime-3 prime). 600 ng 
de I'ADN double brin de grb2 (1-639) ont ete associes avec : 

1. 3 jig d'ARN de grb33 

2. 3 ^g d'ARN de grb2 

3. de I'eau 

dans trois reactions differentes, dans le tampon suivant : 
100 mM PIPES (pH 7,2), 35 mM NaCI, 10 mM EDTA, 70% formamide 
deionise (Sigma) 

Les echantillons ont ete amenes a 56 °C puis refroidis a 44 °C 
par increment de -0,2 °C toutes les 10 minutes, lis sont ensuite conserves a 
4 °C. L'analyse sur gel d'agarose revele des modifications de migrations 
dans les puits 1 et 2 par rapport au puits 3 controle (Figure 11 A) indiquant la 
formation de nouveaux complexes. Les echantillons sont ensuite traites au 
glyoxal deionise (Sigma) (5% v/v ou 1M) pendant 2 h a 12 °C. Les 
complexes sont ensuite precipites a l'6thanol (0,1 M NaCI, 2 volumes 
d'ethanol), laves a Methanol 70%, seches puis repris dans de I'eau. lis sont 
enfin traites par la RnaseH (Life Technologies), puis par une enzyme capable 
de degrader specifiquement I'ADN simple brin. La nuclease S1 et la 
nuclease 11 Mung Bean " presentent cette propriete et sont disponibles 
commercialement (Life Technologies, Amersham). De telles digestions 
(incubations de 5 minutes dans les tampons fournis avec les enzymes) ont 
6te analysees sur gel d'agarose (figure 11B). Des digestions significatives 
sont uniquement obtenues a partir des complexes issus de la reaction 1 
(grb2/grb33) (figure 11B, puits 7 et 10). Ces digestions semblent plus 
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completes avec la nuclease S1 (puits 7) qu'avec la nuclease " Mung Bean " 
(puits 10). Ainsi, la bande correspondant a une taille legerement superieure a 
100 paires de bases (indiquee par une fleche dans le puits 7) a 6te purifiee, 
donee dans le vecteur pMos-Blue (Amersham), puis sequencee. Ce 
5 fragment correspond au domaine de 120 paires de bases de grb2, delete 
dans grb33. 

Cette approche peut maintenant etre effectuee a partir d'une 
population totale d'ARN messager et d'une population totale d'ADNc double 
brin produite selon les techniques connues de I'homme de metier. La 
10 population d'ARN de la situation de reference est hybridee a la population 
d'ADNc double brin de la situation test et reciproquement. Apres application 
du protocole decrit ci-dessus, les digestions sont deposees sur gel d'agarose 
afin d'isoler et de purifier les bandes correspondant a des tailles variant entre 
50 et 300 paires de bases. Ces bandes sont ensuite donees dans un 
15 vecteur (pMos-Blue, Amersham) pour donner lieu a une banque d'inserts 
enrichis en des evenements de differences qualitatives. 

3. CONSTRUCTION DE BANQUES ISSUES DE CRIBLAGES 
DIFFERENTIELS QUALITATIFS. 

Les deux exemples decrits ci-dessus aboutissent aux clonages 
d'ADNc representatifs de toute ou partie des sequences epissees 
differentiellement entre deux situations physiopathologiques donnees. Ces 
ADNc permettent la constitution de banques par insertion de ces ADNc dans 
des vecteurs plasmidiques ou phagiques. Ces banques peuvent etre 
presentees sur des filtres de nitrocellulose ou tout autre support connu de 
rhomme de Tart, tels des chips ou biopuces ou membranes. Ces banques 
peuvent etre conservees au froid, a Tabri de la lumiere. Ces banques, une 
fois deposees et fixees sur support par les techniques classiques, peuvent 
etre traitees par des composes pour eliminer les bacteries hotes qui 
permettent la production des plasmides ou des phages. Ces banques 



WO 99/46403 



69 



PCT/FR99/00547 



peuvent egalement avantageusement etre constitutes de fragments d'ADNc 
correspondant aux ADNc clones mais prepares par PCR de fagon a ne 
deposer sur filtre que les sequences derivees des evenements d'epissages 
alternatifs. . 

5 Uune des caracteristiques et en meme temps Tune des 

originates du criblage differentiel qualitatif est que cette technique aboutit de 
fagon avantageuse non pas a une mais a deux banques differentielles ("paire 
de banque") qui represented I'ensemble des differences qualitatives qui 
existent entre deux situations donnees. En particulier, Tune des banques 

10 d'epissage differentiel de Pinvention represente la signature des qualites de 
la situation physiologique test par rapport a la situation physiologique de 
reference, et I'autre banque represente la signature des qualites de ia 
situation physiologique de reference par rapport a ia situation physiologique 
test. Ce couple de banques est egalement designe paire de banques ou 

is "banque differentielle d'epissage". 

L'un des apports du criblage differentiel qualitatif etant de 
permettre d'evaluer le potentiel toxique d'un compose, comme cela est 
indique dans le chapitre suivant, un bon exemple de mise en oeuvre de la 
technologie est I'obtention par DATAS de clones d'ADNc correspondant a 

20 des sequences specifiques de cellules HepG2 naTves, d'une part, et traitees 
par de I'ethanol, d'autre part. Ces cellules presentent des signes de 
cytotoxicite et une degradation de leur ADN par fragmentation 
intemucleosomale a partir de 18h en presence de 1M d'ethanol. De fagon a 
obtenir des marqueurs precoces de ia toxicite ethanolique, les ARN 

25 messagers ont ete prepares a partir de cellules naives et de cellules traitees 
pendant 18h par de I'ethanol a la concentration de 0,1 M. Apres mise en 
oeuvre de la variante de DATAS qui utilise I'ADNc simple brin et la Rnase H, 
les ADNc clones obtenus ont ete amplifies par PCR, soumis a une 
electrophorese sur gel d'agarose et ensuite transferes sur un filtre de nylon 

30 selon les techniques connues de I'homme de I'art. Pour chaque ensemble de 
clones specifiques d'une part des differences qualitatives specifiques de 
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I'etat naif et d'autre part des sequences specifiques des cellules traitees par 
I'ethanol, deux repliques identiques de filtres sont effectuees. Ainsi les 
empreintes de chaque ensemble de clones sont hybridees d'une part avec 
une sonde specifique des cellules non traitees et d'autre part avec une 
sonde specifique des cellules traitees par 0,1 M d'ethanol pendant 18h. 

Le profil d'hybridation differentiel obtenu et presente sur la figure 12 
permet d'apprecier la qualite de la soustraction effectuee lors de la mise en 
oeuvre de la technique DATAS. Ainsi les clones issus de ('hybridation de 
I'ARNm de cellules non traitees (NT) avec I'ADNc de cellules traitees (Tr) et 
qui doivent correspondre a des differences qualitatives specifiques de la 
situation naive hybrident preferentiellement avec une sonde representant la 
population totale des ARN messagers des cellules non traitees. 
Reciproquement, les clones issus des produits resistant a la RNase H ayant 
agi sur les heteroduplex ARN (Tr)/AD Nc( NT) hybrident preferentiellement 
15 avec une sonde derivee de la population totale des ARN messagers des 
cellules traitees. 

Les deux ensembles de clones specifiques d'une part de la 
situation traitee et d'autre part de la situation non traitee represented un 
exemple de banques de differences qualitatives caracteristiques de deux 
20 etats cellulaires distincts. 

4. UTILISATIONS ET APPORTS DES BANQUES DIFFERENTIELLES 
QUALITATIVES. 

25 Les possibilites d'utilisation des banques differentielles 

d'epissage de I'invention sont illustrees notamment sur les Figures 13 a 15. 
Ainsi, ces banques sont utilisables pour : 



30 



4.1 . L'evaluation du potentiel toxique d'un compose (figure 13) : 

Dans cet exemple, ia situation de reference est designee A et la 
situation toxique est designee B. Des abaques de toxicite sont obtenues par 
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traitement de la situation A en presence de differentes concentrations d'un 
compose toxique de reference, pendant des periodes variables. A differents 
points ies abaques de toxicite, des banques differentielles qualitatives sont 
construites (paires de banque), dans cet exemple, des banques restreintes 
5 rA/cB et rB/cA. Les paires de banque sont avantageusement deposees sur 
un support. Le support est ensuite hybride avec des sondes issues de 
I'echantillon biologique initial traite par differentes doses de composes test : 
Produits X, Y et Z. L'hybridation est revelee et fait apparattre le potentiel 
toxique des produits test : dans cet exemple, le produit Z presente une forte 
10 toxicite et le produit Y offre un profil intermediate. La faisabilite de cette 
constitution d'abaques de toxicite est bien illustree par I'exemple de 
constitution de banques de criblage differentiel qualitatif decrit ci-avant et 
mettant en jeu I'ethanol et des cellules HepG2. 

15 4.2. devaluation de Pefficacite d'une composition pharmaceutique 

(figure 14) : 

Dans cet exemple, une paire de banques restreintes selon 
Tinvention est realisee a partir d'un modele pathologique B et d'un modele 
sain A (ou du modele pathologique traite avec un produit actif de reference). 

20 Les banques differentielles rA/cB et rB/cA sont, le cas echeant, deposees sur 
un support. Cette paire de banque regroupe les differences d'epissage entre 
les deux situations. Cette paire de banque permet d'evaluer Tefficacite d'un 
compose test, c'est-a-dire de determiner sa capacite a generer un profil de 
type "sain" (rA/cB) a partir du profil de type pathologique (rB/cA). Dans cet 

25 exemple, la paire de banque est hybridee avec des sondes preparees a 
partir des situations A et B avec ou sans traitement par le compose test. Le 
profil d'hybridation qui peut etre obtenu est presente sur la figure 14. La 
faisabilite de cette application est la meme que celle de la constitution de 
banques de differences qualitatives caracteristiques de situations saines et 

30 toxiques presentee plus-haut. La situation toxique est remplacee par I'etat 
pathologique et il est possible d'apprecier la capacite d'un compose test a 
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produire une sonde hybridant avec plus ou moins de preference avec ies 
situations de reference ou pathologique. 

4.3. (-'anticipation de la reponse d'un echantillon pathologique a un 
5 traitement (figure 15) : 

Dans cet exemple, une paire de banque restreinte selon 
Tinvention est realisee a partir de deux modeles pathologiques, dont Tun 
repond a un traitement par un produit donne (le gene p53 sauvage par 
exemple) : situation A ; et I'autre y est refractaire : situation B. Cette paire de 
10 banque (rA/cB ; rB/cA) est deposee sur un support. 

Cette paire de banque est ensuite utilisee pour determiner la 
sensibilite d'un echantillon pathologique test a ce meme produit. Pour cela, 
cette paire de banque est hybridee avec des sondes provenant de biopsies 
de patients dont on souhaite anticiper la reponse au traitement de reference. 
15 Le profil d'hybridation d'une biopsie de repondeur et d'une biopsie. de non- 
repondeur est presente sur la figure 15. 

4.4 (.'identification de ligands pour des recepteurs orphelins 

L'activation de recepteurs membranaires ou nucleaires par 

20 leurs ligands pourrait induire specifiquement des dysregulations dans 
I'epissage de certains ARNs. ^identification de ces evenements par Ies 
methodes DATAS de Tinvention permet de disposer d'un outil (marqueurs, 
banques, kits, etc.) de suivi d'activation de recepteurs, utilisables pour la 
recherche de ligands naturels ou synthetiques de recepteurs, en particulier 

25 orphelins. Selon cette application, des marqueurs associes aux 
dysregulations sont identifies et deposes sur des supports. L'ARN total de 
cellules, (sur)exprimant le recepteur a Tetude, traitees ou non par differentes 
compositions et/ou composes tests, est extrait et utilise comme sonde dans 
une hybridation avec Ies supports. La mise en evidence d'une hybridation 

30 avec certains, voire la totalite des marqueurs deposes sur le support, indique 
que le recepteur a l'6tude a ete active, et done que le composition/compose 
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correspondant constitue ou comprend un ligand dudit recepteur. 

4.5 L'identification de cibles d'interet therapeutique : 

Celle-ci se fait par identification de genes dont I'epissage est 
5 modifie dans une pathologie ou dans un modele de pathologie et plus 
precisement ('identification des exons ou introns modifies. Cette approche 
doit permettre de donner acces aux sequences qui cedent les domaines 
fonctionnels alteres lors de pathologies ou de tout phenomene 
physiopathologique adressant les phenomenes de proliferation, 

10 differentiation ou apoptose par exemple. 

Un exemple de rapport du criblage differentiel qualitatif a 
l'identification de genes differentiellement episses est fourni par Tapplication 
de DATAS a un modele d'induction d'apoptose par induction de 1'expression 
de la forme sauvage de p53. Ce modele cellulaire a ete etabli par 

15 transfection d'un systeme d'expression inductible pour le gene suppresseur 
de tumeur p53. De fagon a identifier les differences qualitatives qui sont 
associes specifiquement a Tapoptose induite par p53, DATAS a ete mise en 
ceuvre a partir des ARN messagers extraits de cellules induites et non 
induites. Pour ces experiences 200ng d'ARN polyA+ et 200ng d'ADNc ont 

20 ete utilises lors de la formation des heteroduplex. Une centaine de clones a 
ete obtenue a partir de chacune des hybridations croisees. L'hybridation de 
ces clones bacteriens puis des fragments d'ADNc qulls contiennent avec 
des sondes representatives des ARN messagers totaux des situations de 
depart a permis ('identification de sequences specifiquement exprimees lors 

25 de la forte induction de p53 qui aboutit a la mort cellulaire (figure 16). 

Ces fragments derivent de sequences exoniques ou introniques qui 
modulent la qualite du message present et permettent de proposer les 
domaines fonctionnels auxquels ils participent ou qulls interrompent comme 
des cibles d'intervention pour induire ou inhiber la mort cellulaire. 

30 Une telle approche aboutit egalement a la constitution d'une paire de 

banques qui rassemblent des evenements differentiellement episses entre 
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une situation non apoptotique et une situation apoptotique. Cette paire de 
banque peut etre utilisee pour tester le pouvoir hybridant d'une sonde 
derivee d'une autre situation physiopathologique ou d'un traitement 
particulier. Le resultat d'une telle hybridation donnera des indications sur 
5 I'engagement eventuel du programme d'expression genetique de la situation 
testee vers I'apoptose. 

Comme il ressort de la description ci-avant, I'invention concerne 

egalernent : 

10 - toute sonde nucleique, tout oligonucleotide, tout anticorps 

dirige contre une sequence identifiee par la technique decrite dans la 
presente demande et caracterises en ce qu'ils permettent de caracteriser 
une situation pathologique, 

- 1'utilisation des informations issues de 1'utilisation des 
15 techniques decrites pour la recherche de molecules organiques a vis6e 

therapeutique par la mise en place de criblages caracterises en ce qu'ils 
ciblent des domaines splices differentiellement entre une situation saine et 
une situation pathologique ou bien caracterises en ce qu'ils sont bases sur 
('inhibition des gains de fonctions acquis par la proteine resultant d ! un 
20 epissage differentiel, 

- Tutilisation des informations issues des techniques decrites 
dans la presente demande pour des applications de therapie genique, 

- I'utilisation d'ADNc transferes par therapie genique 
caracterises en ce qu'ils ont des proprietes antagonistes ou agonistes sur 

25 des voies de signalisation cellulaires d§finies, 

- toute constitution et toute utilisation de banques moleculaires 
d'exons ou d'introns alternatifs a des fins: 

. de diagnostic ou de reactifs commerciaux pour la 

recherche 

30 . de creer ou de rechercher des molecules, polypeptides, 

acides nucleiques pour application therapeutique. 
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- toute constitution et toute utilisation de banques virtuelles 
informatiques regroupant des exons ou introns alternatifs caracterises en ce 
que ces banques permettent de concevoir des sondes nucleiques ou des 
amorces oligonucleotidiques dans le but de caracteriser les epissages 

5 alternatifs qui differentient deux etats physiopathologiques distincts. 

- toute composition pharmaceutique ou diagnostique 
comprenant des polypeptides, acides nucleiques sens ou anti-sens, ou des 
molecules chimiques capables d'interferer avec les produits d'epissage 
alternatifs mis en evidence et clones par les techniques de ('invention, 

io toute composition pharmaceutique ou diagnostique 

comprenant des polypeptides, acides nucleiques sens ou anti-sens, ou des 
molecules chimiques capables de restaurer un epissage representatifs d'une 
situation normale par opposition a I'evenement alternatif caracteristique d'une 
situation pathologique. 

15 

5. DEREGULATIONS DES MECANISMES D'EPISSAGE DES ARNS 
PAR DES AGENTS TOXIQUES. 

Cet exemple montre que les differences de formes et/ou profils 
20 d'epissages peut etre utilisee comme marqueur pour le suivi et/ou la 
detection de toxicite et/ou d'efficacite de composes. 

Les effets d'agents toxiques sur les deregulations d'epissages des 
ARNs a ete teste de la maniere suivante. Des cellules hepatocytaires, 
HepG2, ont ete traitees par differentes doses de trois composes toxiques 
25 (ethanol, camptothecine, PMA (Phorbol 12-Myristate 1 3-Acetate)). Deux 
tests de cytotoxicity (Bleu de Trypan, MTT) ont ete realises a differents 
temps : 4h et 18h pour Tethanol ; 4h et 18h pour la camptothecine ; 18h et 
40h pour le PMA. 

Le Bleu de Trypan est un colorant qui peut etre incorpore par les 
30 cellules vivantes. Un simple comptage des cellules "bleues" et "blanches" 
sous microscope permet de determiner le pourcentage de cellules vivantes 
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apres traitement ou pourcentage de survie. Les points sont effectues en 
triplicates. 

Le test MTT est un test colorimetrique qui mesure la capacite des 
cellules vivantes a convertir les sels solubles de tetrazolium (MTT) en un 
5 precipite insoluble de formazan. Ces cristaux de formazan, bleu fence, 
peuvent etre dissous et leur concentration determinee par mesure 
d'absorbance a 550 nm. Ainsi, apres ensemencement de plaques 24 puits 
par 1 50000 cellules sur la nuit, puis traitement des cellules par les composes 
toxiques, est ajoute 50 \i\ de MTT (Sigma) (a 5 mg/ml dans du PBS). La 

10 reaction de formation des cristaux de formazan s'effectue en 5 h dans 
Tincubateur a C02 (37°C, 5% C02, 95% humidite). Apres addition de 500 pi 
de solution de solubilisation (Hcl O f 1N dans Isopropanol-Triton X-100 (10%)), 
les cristaux sont dissous sous agitation et les absorbances mesurees a 550 a 
660nm. Les points sont effectues en triplicates avec les controles (viabilite, 

15 mort cellulaire, blancs) appropries. 

Un test d'apoptose ou mort cellulaire programmee a egalement 6te 
realise par mesure de la fragmentation d'ADN via Putilisation d'anticorps anti- 
histone et de mesures d'ELISA. Le test utilise est Cell Death ELISA Plus de 
Roche. 

20 Les resultats de ces trois tests (Figures 18 A,B,C) ont permis de 

determiner que les doses suivantes : 

• ethanol : 0,1 M 

• camptothecine : 1 MQ/ml 
25 • PMA : 50 ng/ml 

etaient bien inferieures aux IC50s mesurees. 

Les cellules HepG2 ont ainsi ete traitees par ces trois composes a ces 
trois doses pendant 4 h pour I'ethanol et la camptothecine et 18 h pour le 
PMA. Les ARNs messagers ont ete purifies par billes Dyna|-Oligo-(dT) a 
30 partir d'ARNs totaux purifies selon le kit Rneasy (Quiagen). Des syntheses 
d'ADNc ont ete effectuees a partir de ces ARNs messagers et de la 
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Transcriptase Inverse Superscript (Life Technologies) en utilisant des 
hexameres aleatoires comme amorces. 

Ces premiers brins ont servi de matrices a des reactions 
d'amplification par PCR (94°C 1mn, 55°C 1mn, 72°C 1mn, 30 cycles) a I'aide 
5 des amorces oligonucleotidiques suivantes : 

MACH-a: 

5'-TGCCCAAATCAACAAGAGC-3' (SEQ ID NO: 1 1 ) 
io 5'-CCCCTGACAAGCCTGAATA-3' (SEQ ID NO: 12) 

Ces amorces correspondent a des regions communes aux differentes 
isoformes decrites de MACH-a (1,2 et 3, amplifiant respectivement 595, 550 
et 343 paires de bases). MACH-a (Caspase-8) est une protease impliquee 
15 dans la mort cellulaire programmee (Boldin et.al., Cell (1996), 85, 803-815). 

BCL-X : 

5' ATGTCTCAGAGCAACCGGGAGCTG 3" (SEQ ID NO: 13) 
20 5' GTGGCTCCATTCACCGCGGGGCTG 3' (SEQ ID NO: 14) 

Ces amorces correspondent a des regions communes aux differentes 
isoformes decrites de bcl-X (bcl-XI, bcl-Xs, BCL-XB) (Boise et al., Cell (1993) 
74, 597-608; U72398 (Genbank)) et doivent amplifier un fragment unique 
25 pour ces trois isoformes de 204 paires de bases. 

FASR: 

5'-TGCCAAGAAGGGAAGGAGT-3' (SEQ ID NO: 15) 
30 5'-TGTCATGACTCCAGCAATAG-3' (SEQ ID NO: 16) 
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Ces amorces correspondent a des regions communes a certaines 
isoformes de FASR et doivent amplifier un fragment de 478 paires de bases 
pour la forme sauvage de FasR, 452 pour Pisoforme A8 et 415 pour 
5 Tisoforme ATM. 

Les resultats rapportes sur la figure 19 indiquent que : 

• la camptothecine induit une diminution de Pexpression de Tisoforme 
MACH-a1 et une augmentation de Tisoforme MACH-cc3. 

10 • La camptothecine induit Tapparition d'une nouvelle isoforme de bcl-X 

(bande superieure du doublet migrant vers 200 paires de bases). 

• La camptothecine induit une diminution de la forme sauvage du 
recepteur de fas, remplace par une expression d'une isoforme plus courte 
pouvant correspond re a Fas ATM. 

is • L'ethanol induit la disparition de bcl-x, remplace par une isoforme 

plus courte. 

• Methanol induit une augmentation de la forme longue, sauvage, du 
recepteur de fas, ceci aux depens de Tisoforme plus courte. 

20 Ces resultats demontrent que des traitements par des agents toxiques 

a des doses faibles peuvent induire des dysregulations d'epissages 
alternatifs de certains ARNs, ceci de fa?on specifique. ^identification de ces 
dysregulations au niveau post-transcriptionnel, notamment par Tapplication 
de la technologie DATAS permet ainsi de definir un outil predictif de la 

25 toxicite de molecules. 
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REVENDICATIONR 

1. Precede ^identification et/ou de clonage de regions decides 
nucleiques representatives de differences genetiques qualitatives entre deux 
5 echantillons biologiques, comprenant une etape d'hybridation d'une 
population d'ARN ou d'ADNc double-brin provenant d'un premier echantillon 
biologique avec une population d'ADNc provenant d'un deuxieme echantillon 
biologique. 

10 2. Precede selon la revendication 1 caracterise en ce qu'il comprend : 

(a) ('hybridation des ARN provenant du premier echantillon 
(situation test) avec les ADNc provenant du deuxieme echantillon (situation 
de reference); 

(b) Thybridation des ARN provenant du deuxieme echantillon 
15 (situation de reference) avec les ADNc provenant du premier echantillon 

(situation test); et 

(c) ('identification et/ou le clonage, a partir des hybrides formes 
en (a) et (b), d'acides nucleiques correspondant a des differences genetiques 
qualitatives. 

20 

3. Precede selon la revendication 1 ou 2 caracterise en ce que les 
hybridations sont realisees entre une population d'ARN et des ADNc simple- 
brins et en ce qu'il comprend ['identification et/ou le clonage de regions 
d'ARN non appariees. 

25 

4. Precede selon la revendication 1 ou 2 caracterise en ce que les 
hybridations sont realisees entre une population d'ARN et des ADNc double- 
brins et en ce qu'il comprend ['identification et/ou le clonage de regions 
d'ADN appariees. 

30 

5. Precede selon la revendication 1 caracterise en ce qu'il comprend 
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rhybridation entre une population d'ADNc double-brin provenant d'un premier 
6chantillon biologique et une population d'ADNc simple-brin provenant d'un 
deuxieme echantillon biologique. 

5 6. Procede selon Tune des revendications 1 a 5 caracterise en ce que 

I'echantillon biologique est compose de cellules, d'un tissu, d'un organe ou 
d'une biopsie. 

7. Procede selon Tune des revendications 1 a 6 pour Identification 
10 et/ou le clonage d'epissages alternatifs differentiels entre des cellules 

tumorales et des cellules non-tumorales. 

8. Procede selon Tune des revendications 1 a 6 pour Identification 
et/ou le clonage d'epissages alternatifs differentiels entre des cellules traitees 

15 par un compose test et des cellules non-traitees. 

9. Procede selon Tune des revendications 1 a 6 pour ('identification 
et/ou le clonage d'epissages alternatifs differentiels entre des cellules en 
apoptose et des cellules non-apoptotiques. 

20 

10. Procede selon Tune des revendications 1 a 9 caracterise en ce 
que rhybridation est realisee en phase liquide. 

11. Procede d'identification et/ou de clonage de regions d'acides 
25 nucleiques epissees differentiellement entre deux situations physiologiques A 

et B, comprenant : 

(a) la formation d'heteroduplex en phase liquide entre les ARN 
messagers provenant de la situation A et les ADNc provenant de la situation 
B d f une part; 

30 (b) la formation d'heteroduplex en phase liquide entre les ARN 

messagers provenant de la situation B et les ADNc provenant de la situation 
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A d'autre part; et 

(c) ^identification et/ou le clonage des regions d'ARN non 
appariees dans les heteroduplex obtenus en (a) et en (b). 

5 12. Procede d'identification et/ou de clonage de regions d'acides 

nucleiques epissees differentiellement entre deux situations physiologiques A 
et B, comprenant : 

(a) la formation d'heteroduplex entre les ARN messagers 
provenant de la situation A et les ADNc provenant de la situation B d'une 

10 part, les ARN ou les ADNc etant immobilises sur un support ; 

(b) la formation d'heteroduplex entre les ARN messagers 
provenant de la situation B et les ADNc provenant de la situation A d'autre 
part, les ARN ou les ADNc etant immobilises sur un support ; et 

(c) Identification et/ou le clonage des regions d'ARN non 
15 appariees dans les heteroduplex obtenus en (a) et en (b). 

13. Composition comprenant les acides nucleiques identifies et/ou 
clones selon les precedes des revendications 1 a 12. 

20 14. Composition d'acides nucleiques, caracterisee en ce qu'elle 

comprend essentiellement les acides nucleiques representatifs d'alterations 
genetiques qualitatives, notamment des epissages alternatifs distinguant 
deux situations physiologiques d'une cellule ou d'un tissu. 

25 15. Composition selon les revendications 13 ou 14 caracterisee en ce 

que les acides nucleiques sont clones dans des vecteurs. 

16. Banque d'acides nucleiques comprenant des acides nucleiques 
specifiques d'alterations genetiques qualitatives, notamment d'epissages 
30 alternatifs distinguant deux situations physiologiques d'une cellule ou d f un 
tissu. 
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17. Banque selon la revendication 16, caracterisee en ce qu'il s'agit 
d'une banque restreinte aux epissages alternatifs qui caracterisent les ARN 
matures. 

5 

18. Banque selon la revendication 16, caracterisee en ce qu'il s'agit 
d'une banque complexe des epissages alternatifs qui caracterisent les 
transcrits. 

io 19. Banque selon la revendication 16, caracterisee en ce qu'il s'agit 

d'une banque autologue caracteristique des epissages alternatifs entre les 
ARN matures et premessagers d'une situation physiologique. 

20. Banque d'acides nucleiques comprenant des oligonucleotides ou 
15 des fragments PCR specifiques d'epissages alternatifs distinguant deux 

situations physiologiques. 

21. Banque de microorganismes comprenant des microorganismes 
transformes par des acides nucleiques specifiques d'epissages alternatifs 

20 distinguant deux situations physiologiques d'une cellule ou d'un tissu. 

22. Banque selon les revendications 16 a 21 caracterisee en ce qu'elle 
est deposee sur un support. 

25 23. Kit comprenant un support sur lequel est depose une banque 

selon I'une des revendications 16 £ 21. 

24. Kit selon la revendication 23 caracterise en ce qu'il comprend deux 
banques selon I'une des revendications 16 a 21, deposee sur un meme 
30 support ou sur deux supports distincts. 
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25. Kit seion les revendications 23 ou 24 caracterise en ce que le 
support est compose cfun filtre, membrane ou d'une puce. 

26. Utilisation d'une composition selon Tune des revendications 13 a 
5 15 ou d'une banque selon les revendications 16 a 21 pour ('identification de 

molecules actives. 

27. Utilisation d'une composition selon Tune des revendications 13 a 
15 ou d'une banque selon les revendications 16 a 21 pour ['identification de 

10 proteines ou domaines proteiques affectes dans une pathologie. 

28. Utilisation d'une composition selon I'une des revendications 13 a 
15 ou d'une banque selon les revendications 16 a 21 pour ('identification de 
domaines antigeniques specifiques de proteines impliquees dans une 

is pathologie. 

29. Methode d'identification et/ou de production de proteines ou 
domaines proteiques impliques dans une pathologie comprenant : 

(a) ('hybridation des ARN messagers d'un echantillon 
20 pathologique avec les ADNc d'un echantillon sain, ou I'inverse, ou les deux 

en parallele, 

(b) I'identification, dans des hybrides formes, des regions 
correspondant aux differences qualitatives specifiques de Petat pathologique 
par rapport a I'etat sain, 

25 (c) I'identification et/ou la production d'une proteine ou domaine 

proteique correspondant a une region identifiee en (b). 

30. Procede d'identification et/ou de clonage de genes suppresseurs 
de tumeurs ou d'epissages au sein de genes suppresseurs de tumeurs, 

30 comprenant : 

(a) I'hybridation des ARN messagers d'un echantillon de tumeur 
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avec les ADNc d'un echantillon sain, ou I'inverse, ou les deux en parallele, 

(b) Tidentification, dans les hybrides formes, des regions 
correspondant aux differences qualitatives specifiques de I'echantillon 
tumoral par rapport a Petat sain, 
5 (c) ('identification et/ou la production d'une proteine ou domaine 

proteique correspondant a une region identifiee en (b). 

31 . Composition comprenant un compose capable d'interferer avec les 
produits d'epissages altematifs identifies selon le procede des revendications 

10 1a 12. 

32. Proteine susceptible d'etre identifiee par le procede de la 
revendication 29. 

15 33. Utilisation d'une banque selon les revendications 16 a 21 pu d'un 

kit selon les revendications 23 a 25 pour evaluer la toxicite d'un compose. 

34. Procede d'identification et/ou de clonage d'acides nucleiques 
specifique d'un etat toxique d'un echantillon biologique donne comprenant la 
20 preparation de banques differences qualitatives entre les ARN et les ADNc 
de I'echantillon apres ou sans traitement par un compose toxique test, et la 
recherche de marqueurs de toxicite specifiques des qualites de I'echantillon 
apres traitement. 

25 35. Procede de determination ou devaluation de la toxicite d'un 

compose test sur un echantillon biologique donne comprenant Thybridation : 

- de banques differentielles entre les ADNc et les ARN dudit 
echantillon biologique a I'etat sain et a un ou differents stades de toxicite 
resultant d'un traitement dudit echantillon avec un compose toxique de 

30 reference, avec, 

- une preparation d'acides nucleiques de I'echantillon biologique 
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traite par ledit compose test, et 

- revaluation du potentiel toxique du compose test par analyse 
du degre d'hybridation avec les differentes banques. 

5 36. Procede selon la revendication 35 caracterise en ce que 

['echantillon biologique est une culture d'hepatocytes, de cellules epitheliales 
renales ou de cellules endothelials, traitee ou non par un agent toxique, de 
preference Pethanol. 

10 37. Procede selon la revendication 35 caracterise en ce que 

I'echantillon biologique est une culture de peau traitee ou non par des agents 
toxiques ou irritants. 

38. Utilisation d'une banque selon les revendications 16 a 21 ou d'un 
15 kit selon les revendications 23 a 25 pour evaluer I'efficacite d'un compose. 

39. Procede de determination ou devaluation de I'efficacite 
therapeutique d'un compose test sur un echantillon biologique donne 
comprenant I'hybridation : 

20 - de banques differentielles entre les ADNc et les ARN dudit 

echantillon biologique a Tetat sain et a Tetat pathologique avec, 

- une preparation d'acides nucleiques de rechantillon biologique 
traite par ledit compose test, et 

- revaluation du potentiel therapeutique du compose test par 
25 analyse du degre d'hybridation avec les differentes banques. 

40. Utilisation d'une banque selon les revendications 16 a 21 ou d'un 
kit selon les revendications 23 a 25 pour evaluer la reponse d'un echantillon 
pathologique a un compose. 

30 

41. Procede de determination ou devaluation de la reponse d'un 
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patient a un compose ou traitement test comprenant I'hybridation : 

- de banques differentielles entre les ADNc et les ARN d'un 
echantillon biologique repondeur audit compose/traitement et d'un 
echantillon biologique non-repondeur ou mal-repondeur audit 

5 compose/traitement, avec, 

- une preparation d'acides nucleiques d'un echantillon 
biologique pathologique du patient, et 

- revaluation du potentiel repondeur du patient par analyse du 
degre d'hybridation avec les differentes banques. 

42. Precede selon la revendication 41 pour la determination ou 
revaluation de la reponse d'un patient a un compose ou traitement 
antitu moral. 

15 43. Precede selon la revendication 42 pour ia determination ou 

revaluation de la reponse d'un patient a un traitement antitumoral par 
transfert du gene p53 sauvage. 

44. Acide nucleique susceptible d'etre identifie par le precede selon 
20 les revendications 1 a 12. 

45. Utilisation d'un acide nucleique selon la revendication 44 pour ia 
detection d'anomalies genetiques dans un echantillon. 

25 46. Utilisation d'un compose selon la revendication 28 pour la 

detection d'une anomalie genetique dans un echantillon. 

47. Anticorps dirige contre une proteine ou un domaine proteique tel 
que defini dans la revendication 27 ou 28. 

30 

48. Proteine ASHC de sequence SEQ ID NO: 9. 
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49. Sonde nucleique, oligonucleotide ou anticorps permettant d'identifier la 
proteine ASHC selon la revendication 48 ou son acide nucleique, et/ou une 
alteration du rapport SHC/ASHC dans un echantillon biologique. 

5' 

50. Precede de criblage caracterise en ce qu'il est base sur le blocage du 
domaine episse dans la proteine SHC ou sur le blocage des gains de fonction 
acquis par la proteine epissee A SHC. 

10 51. Vecteur comprenant une sequence codant pour la proteine ASHC 

selon la revendication 48. 

52. Procede selon les revendications 3, 4 ou 5 caracterise en ce que 
le clonage des acides nucleiques comprend la transcription inverse et/ou 

15 ('amplification au moyen d*amorces aleatoires ou semi-aleatoires, en 
particulier d'amorces de sequence SEQ ID NO: 3 dans laquelle N indique 
que chacune des quatre bases peut etre presente de fagon aleatoire a la 
position indiquee, W, X et Y designent chacun une base determinee, et Z 

designe soit une base determinee, soit un groupe 3 f -OH. 

i 

20 

53. Oligonucleotide comprenant, dans I'orientation 5' — > 3' : 

- une zone stabilisatrice comprenant_8 a 24 nucleotides determines, 

- une region aleatoire comprenant de 3 a 8 nucleotides, et 

- une zone minimale d'amorgage comprenant 2 a 4 nucleotides 
25 definis. 

54. Oligonucleotide de sequence SEQ ID NO: 3 dans laquelle : 

- N indique que chacune des quatre bases peut etre presente 
de fagon aleatoire a la position indiquee; 

- W, X et Y designent chacun une base determinee, 

30 - Z designe soit une base determinee, soit un groupe 3'-OH. 
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55. Banque d'ADN genomique caracterisee en ce qu'elle est 
constitute de fragments d'ADN genomiques de taille inferieure ou egale 3 1 
kb environ. 

5 

56. Methode de detection ou de suivi du potentiel toxique et/ou 
therapeutique d'un compose, basee sur la detection de formes et/ou de 
profits d'epissages induits par ce compost sur un echantillon biologique. 

10 57. Utilisation, comme source de marqueurs de pharmacogenomique, 

(i) de rintervariabilite, entre individus, d'isoformes generees par epissage 
alternatif (analyse du spliceome) ou (ii) de modifications d'epissage induites 
par des traitements. 
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ECHANTILLON TEST 
(B) 



ARN (B) 



ADNC (B) 
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ADNC (A) 
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acides nucleiques 
caracteristiques des 
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B Situations A et B 
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ler brins d 'ADNc 
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Hybridations des 2 brins 
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Digestion par Sau3AI 
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Exons ou introns alternatif de la situation A 

et de la situation B 



1 J 




Sequences de jonction 



Sequences flanquantes 
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Construction de banques differentielles qualitatives a differents points 
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Sequence peptidique de ASHC (SEQ ID NO: 9) 

l 

MNKLSGGGGR RTRVEGGQLG GEEWTRHGSF VNKPTRGWLH PNDKVMGPGV 

SYLVRYMGCV EVLQSMRALD FNTRTQVTRE AISLVCEAVP GAKGATRRRK 

PCSRPLSSIL GRSNLKFAGM PITLTVSTSS LNLMAADCKQ IIANHHMQSI 

SFASGGDPDT AEYVAYVAKD PVNQRACHIL ECPEGLAQDV ISTIGQAFEL 

RFKQYLRNPP KLVTPHDRMA GFDGSAWDEE EEEPPDHQYY NDFPGKEPPL 

GGVVDMRLRE GAAPGAARPT APNAQTPSHL GATLPVGQPV GG DPEVRKQM 

PPPPPCPGRE LFDDPSYVNV QNLDKARQAV GGAGPPNPAI NGSAPRDLFD 

MKPFEDALRV PPPPQSVSMA EQLRGEPWFH GKLSRREAEA LLQLNGDFLV 
RTKDHRFESV SHLISYHMDN HLPIISAGSE LCLQQPVERKL 

441 



Sequence nucleique de ASHC (SEQ ID NO: 10) 



atgaacaagc 


tgagtggagg 


cggcgggcgc 


aggactcggg 


tggaaggggg 


50 


ccagcttggg 


ggcgaggagt 


ggacccgcca 


cgggagcttt 


gtcaataagc 


100 


ccacgcgggg 


ctggctgcat 


cccaacgaca 


aagtcatggg 


acccggggtt 


150 


tcctacttgg 


ttcggtacat 


gggttgtgtg 


gaggtcctcc 


agtcaatgcg 


200 


tgccctggac 


ttcaacaccc 


ggactcaggt 


caccagggag 


gccatcagtc 


250 


tggtgtgtga 


ggctgtgccg 


ggtgctaagg 


gggcgacaag 


gaggagaaag 


300 


ccctgtagcc 


gcccgctcag 


ctctatcctg 


gggaggagta 


acctgaaatt 


350 


tgctggaatg 


ccaatcactc 


tcaccgtctc 


caccagcagc 


ctcaacctca 


400 


tggccgcaga 


ctgcaaacag 


atcatcgcca 


accaccacat 


gcaatctatc 


450 


tcatttgcat 


ccggcgggga 


tccggacaca 


gccgagtatg 


tcgcctatgt 


500 


tgccaaagac 


cctgtgaatc 


agagagcctg 


ccacattctg 


gagtgtcccg 


550 


aagggcttgc 


ccaggatgtc 


atcagcacca 


ttggccaggc 


cttcgagttg 


600 


cgcttcaaac 


aatacctcag 


gaacccaccc 


aaactggtca 


cccctcatga 


650 


caggatggct 


ggctttgatg 


gctcagcatg 


ggatgaggag 


gaggaagagc 


700 


cacctgacca 


tcagtactat 


aatgacttcc 


cggggaagga 


accccccttg 


750 


gggggggtgg 


tagacatgag 


gcttcgggaa 


ggagccgctc 


caggggctgc 


800 


tcgacccact 


gcacccaatg 


cccagacccc 


cagccacttg 


ggagctacat 


850 


tgcctgtagg 


acagcctgtt 


gggggagatc 


cagaagtccg 


caaacagatg 


900 
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ccacctccac caccctgtcc aggcagagag ctttttgatg atccctccta 950 
tgtcaacgtc cagaacctag acaaggcccg gcaagcagtg ggtggtgctg 1000 
gg'ccccccaa tcctgctatc aatggcagtg caccccggga cctgtttgac 1050 
atgaagccct tcgaagatgc tcttcgggtg cctccacctc cccagtcggt 1100 
gtccatggct gagcagctcc gaggggagcc ctggttccat gggaagctga 1150 
gccggcggga ggctgaggca ctgctgcagc tcaatgggga cttcttggtt 1200 
cggactaagg atcaccgctt tgaaagtgtc agtcacctta tcagctacca 1250 
catggacaat cacttgccca tcatctctgc gggcagcgaa ctgtgtctac 1300 
agcaacctgt ggagcggaaa ctgtga 1326 
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1 

LISTE DE SEQUENCES 

<110> EXONHIT THERAPEUTICS SA 

<12 0> CRIBLAGE DIFFERENTIEL QUALITATIF 

<130> B3898B - PB/KM 

<140> 
<141> 

<150> 9802997 
<151> 1998-03-11 

<160> 16 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 23 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<400> 1 

gagaagcgtt atnnnnnnna ggn 23 

<210> 2 
<211> 24 
<212> ADN 

<2-13> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<400> 2 

gagaagcgtt atnnnnnnnn tccc 2 4 

<210> 3 

<211> 23 

<212> ADN 

<213> Sequence artificielle 
<220> 
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<223> Description de la sequence artif icielle : OLIGO 
<400> 3 

gagaagcgtt atnnnnnnnn nnn 23 

<210> 4 
<211> 20 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : OLIGO 
<400> 4 

gagaagcgtt atnnnnncca 20 

<210> 5 

<211> 66 

<212> ADN 

<213> Homo sapiens 

<400> 5 

ccacacctgg ccagtatgtg ctcactggct tgcagagtgg gcagccagcc taagcatttg 60 
cactgg 66 



<210> 6 
<211> 23 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<4 0 0> 6 

gggacctgtt tgacatgaag ccc 



23 



<210> 7 

<211> 22 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 

<400> 7 

cagtttccgc tccacaggtt gc 22 
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<210> 8 

<211> 96 

<212> ADN 

<213> Homo sapiens 

<400> 8 

gtacgggaga gcacgaccac acctggccag tatgtgctca ctggcttgca gagtgggcag 60 
cctaagcatt tgctactggt ggaccctgag ggtgtg 96 

<210> 9 

<211> 441 

<212> PRT 

<213> Homo sapiens 



<400> 9 

Met Asn Lys Leu Ser Gly Gly Gly Gly Arg Arg Thr Arg Val Glu Gly 
1.5 10 15 

Gly Gin Leu Gly Gly Glu Glu Trp Thr Arg His Gly Ser Phe Val Asn 
20 25 30 

Lys Pro Thr Arg Gly Trp Leu His Pro Asn Asp Lys Val Met Gly Pro 
35 40 45 

Gly Val Ser Tyr Leu Val Arg Tyr Met Gly Cys Val Glu Val Leu Gin 
50 55 60 

Ser Met Arg Ala Leu Asp Phe Asn Thr Arg Thr Gin Val Thr Arg Glu 
65 70 75 80 

Ala lie Ser Leu Val Cys Glu Ala Val Pro Gly Ala Lys Gly Ala Thr 
85 90 95 

Arg Arg Arg Lys Pro Cys Ser Arg Pro Leu Ser Ser lie Leu Gly Arg 
100 105 no 

Ser Asn Leu Lys Phe Ala Gly Met Pro lie Thr Leu Thr Val Ser Thr 
115 120 125 

Ser Ser Leu Asn Leu Met Ala Ala Asp Cys Lys Gin lie lie Ala Asn 
130 135 140 

His His Met Gin Ser lie Ser Phe Ala Ser Gly Gly Asp Pro Asp Thr 
145 150 155 160 

Ala Glu Tyr Val Ala Tyr Val Ala Lys Asp Pro Val Asn Gin Arg Ala 
165 170 175 

Cys His lie Leu Glu Cys Pro Glu Gly Leu Ala Gin Asp Val lie Ser 
180 185 190 

Thr lie Gly Gin Ala Phe Glu Leu Arg Phe Lys Gin Tyr Leu Arg Asn 
195 200 205 



BNSOOCID: <WO 9946403A1_i_> 



WO 99/46403 



4 



PCT/FR99/00547 



Pro Pro Lys Leu Val Thr Pro His Asp Arg Met Ala Gly Phe Asp Gly 
210 215 220 

Ser Ala Trp Asp Glu Glu Glu Glu Glu Pro Pro Asp His Gin Tyr Tyr 
225 230 235 240 

Asn Asp Phe Pro Gly Lys Glu Pro Pro Leu Gly Gly Val Val Asp Met 
245 250 255' 

Arg Leu Arg Glu Gly Ala Ala Pro Gly Ala Ala Arg Pro Thr Ala Pro 
260 265 270 

Asn Ala Gin Thr Pro Ser His Leu Gly Ala Thr Leu Pro Val Gly Gin 
275 280 285 

Pro Val Gly Gly Asp Pro Glu Val Arg Lys Gin Met Pro Pro Pro Pro 
290 295 300 

Pro Cys Pro Gly Arg Glu Leu Phe Asp Asp Pro Ser Tyr Val Asn Val ' 
305 310 315 320 

Gin Asn Leu Asp Lys Ala Arg Gin Ala Val Gly Gly Ala Gly Pro. Pro 
325 330 " 335 

Asn Pro Ala lie Asn Gly Ser Ala Pro Arg Asp Leu Phe Asp Met Lys 
340 345 350 

Pro Phe Glu Asp Ala Leu Arg Val Pro Pro Pro Pro Gin Ser Val Ser 
355 360 365 

Met Ala Glu Gin Leu Arg Gly Glu Pro Trp Phe His Gly Lys Leu Ser 
370 375 380 

Arg Arg Glu Ala Glu Ala Leu Leu Gin Leu Asn Gly Asp Phe Leu Val 
385 390 395 400 

Arg Thr Lys Asp His Arg Phe Glu Ser Val Ser His Leu lie Ser Tyr 
405 410 415 

His Met Asp Asn His Leu Pro lie lie Ser Ala Gly Ser Glu Leu Cys 
420 425 430 

Leu Gin Gin Pro Val Glu Arg Lys Leu 
435 440 

<210> 10 

<211> 1326 

<212> ADN 

<213> Homo sapiens 

<400> 10 

atgaacaagc tgagtggagg cggcgggcgc aggactcggg tggaaggggg ccagcttggg 60 
99<=gaggagt ggacccgcca cgggagcttt gtcaataagc ccacgcgggg ctggctgcat 120 



BNSDOCID:<WO 9946403A1 I > 



WO 99/46403 



5 



PCT/FR99/00547 



cccaacgaca aagtcatggg acccggggtt tcctacttgg ttcggtacat gggttgtgtg 180 

gaggtcctcc agtcaatgcg tgccctggac ttcaacaccc ggactcaggt caccagggag 240 

gccatcagtc tggtgtgtga ggctgtgccg ggtgctaagg gggcgacaag gaggagaaag 3 00 

ccctgtagcc gcccgctcag ctctatcctg gggaggagta acctgaaatt tgctggaatg 360 

ccaatcactc tcaccgtctc caccagcagc ctcaacctca tggccgcaga ctgcaaacag 420 

atcatcgcca accaccacat gcaatctatc tcatttgcat ccggcgggga tccggacaca 480 

gccgagtatg tcgcctatgt tgccaaagac cctgtgaatc agagagcctg ccacattctg 540 

gagtgfccccg aagggcttgc ccaggatgtc atcagcacca ttggccaggc cttcgagttg 600 

cgcttcaaac aatacctcag gaacccaccc aaactggtca cccctcatga caggatggct 660 

ggctttgatg gctcagcatg ggatgaggag gaggaagagc cacctgacca tcagtactat 72 0 

aatgacttcc cggggaagga accccccttg gggggggtgg tagacatgag gcttcgggaa 780 

ggagccgctc caggggctgc tcgacccact gcacccaatg cccagacccc cagccacttg 840 

ggagctacat tgcctgtagg acagcctgtt gggggagatc cagaagtccg caaacagatg 90 0 

ccacctccac caccctgtcc aggcagagag ctttttgatg atccctccta tgtcaacgtc 960 

cagaacctag acaaggcccg gcaagcagtg ggtggtgctg ggccccccaa tcctgctatc 102 0 

aatggcagtg caccccggga cctgtttgac atgaagccct tcgaagatgc tcttcgggtg 1080 

cctccacctc cccagtcggt gtccatggct gagcagctcc gaggggagcc ctggttccat 1140 

gggaagctga gccggcggga ggctgaggca ctgctgcagc tcaatgggga cttcttggtt 12 0 0 

cggactaagg atcaccgctt tgaaagtgtc agtcacctta tcagctacca catggacaat 1260 

cacttgccca tcatctctgc gggcagcgaa ctgtgtctac agcaacctgt ggagcggaaa 132 0 
ctgtga 1326 

<210> 11 
<211> 19 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : OLIGO 
<400> 11 

tgcccaaatc aacaagagc 19 

<210> .12 . . _ . 

<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: OLIGO 
<400> 12 

cccctgacaa gcctgaata 19 

<210> 13 
<211> 24 
<212> ADN 
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<213> Sequence artif icielle 
<220> 

<223> Description de la sequence 
<400> 13 

atgtctcaga gcaaccggga gctg 

<210> 14 

<211> 24 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 

<400> 14 

gtggctccat tcaccgcggg gctg 

<210> 15 
<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
<400> 15 

tgccaagaag ggaaggagt 

<210> 16 
<211> 20 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence 
<400> 16 

tgtcatgact ccagcaatag 



artificielle : OLIGO 



24 



artificielle : OLIGO 



24 



artificielle : OLIGO 



19 



artificielle : OLIGO 
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Form PCT/ISA/210 (patent family annex) (July 1992) 



BNSDOCID: <WQ 99464Q3A1 I > 



INTERNATIONAL SEARCH REPORT 

Information on patent family members 



Int itionai Application No 

PCT/FR 99/00547 



Patent document 
cited in search report 


Publication 
date 


Patent family 
member(s) 


Publication 
date 


WO 9527052 A 


12-10-1995 


AU 


2237395 


A 


23-10-1995 






CA 


2186854 


A 


12-10-1995 






EP 


0775202 


A 


28-05-1997 






JP 


9511400 


T 


18-11-1997 






ZA 


9502639 


A 


02-01-1996 



W0 9626272 A 29-08-1996 AU 5172596 A 11-09-1996 

CA 2212846 A 29-08-1996 
EP 0812356 A 17-12-1997 



WO 


9802576 


A 


22-01-1998 


AU 


3494297 


A 


09-02-1998 


FR 


2664287 


A 


10-01-1992 


NONE 








EP 


0330781 


A 


06-09-1989 


JP 


1218590 


A 


31-08-1989 










CA 


1313151 


A 


26-01-1993 










DE 


3855076 


D 


11-04-1996 










DE 


3855076 


T 


17-10-1996 


EP 


0709397 


A 


01-05-1996 


US 


5688918 


A 


18-11-1997 










CA 


2150994 


A 


15-12-1995 










JP 


8081500 


A 


26-03-1996 










US 


5726024 


A 


10-03-1998 



WO 9412631 A 09-06-1994 



AT 


136940 


T 


15- 


-05- 


1996 


CA 


2139410 


A 


03- 


-02- 


1994 


CA 


2149635 


A 


09- 


-06- 


1994 


DE 


69302276 


D 


23- 


-05- 


1996 


DE 


69302276 


T 


19- 


-09- 


1996 


EP 


0651822 


A 


10- 


-05- 


1995 


EP 


0672130 


A 


20- 


-09- 


1995 


WO 


9402633 


A 


03- 


-02- 


1994 


JP 


2800850 


B 


21- 


-09- 


1998 


JP 


8500731 


T 


30- 


-01- 


1996 


JP 


8506801 


T 


23- 


-07- 


1996 


US 


5830646 


A 


03- 


-11- 


1998 


US 


5879898 


A 


09- 


-03- 


1999 



WO 


9746679 


A 


11-12-1997 


AU 


3300397 


A 


05-01-1998 


EP 


0806478 


A 


12-11-1997 


US 


5747650 


A 


05-05-1998 










US 


5726024 


A 


10-03-1998 


WO 


9630512 


A 


03-10-1996 


FR 


2732348 


A 


04-10-1996 










AU 


5402096 


A 


16-10-1996 










BR 


9607928 


A 


09-06-1998 










CA 


2214451 


A 


03-10-1996 










CZ 


9703080 


A 


14-01-1998 










EP 


0817845 


A 


14-01-1998 










HU 


9801221 


A 


28-08-1998 










JP 


11503011 


T 


23-03-1999 










NO 


974449 


A 


26-09-1997 










SK 


131197 


A 


06-05-1998 










ZA 


9602506 


A 


01-10-1996 


US 


5679541 


A 


21-10-1997 


NONE 








WO 


9704092 


A 


06-02-1997 


FR 


2736915 


A 


24-01-1997 



Form PCT/ISA/210 (patent family annex) (July 1992) 

page 1 of 2 

BNSDOCID: <WO 9946403A1J_> 



INTERNATIONAL SEARCH REPORT 

Information on patent family members 



Inte ional Application No 

PCT/FR 99/00547 



Patent document 
cited in search report 



Publication 
date 



Patent family 
member(s) 



Publication 
date 



WO 9704092 



AU 
CA 

cz 

EP 
NO 

SK 



6618696 
2224468 
9800144 
0839194 
980203 
6398 



18-02-1997 
06-02-1997 
15-04-1998 
06-05-1998 
10-03-1998 
09-09-1998 



EP 0791660 



27-08-1997 



JP 10000100 A 



06-01-1998 



Fomi PCT/ISA/210 (patent family annex) (July 1992) 



page 2 of 2 



BNSDOCID: <WO_ 



9946403A1 I > 



RAPPORT DE RECHERCHE INTERNATIONALE 



£X nde Internationale No 

PCT/FR 99/00547 



A. CLASSEMENT DE L'OBJET DE LA OEMANOE 

CIB 6 C12Q1/68 



Selon la classification intemationale des brevet3 (CtB) ou a la fois seton la classification natio nale et la CIB 

B. DOMAINSS SUR LESQUELS LA RECHERCHE A PORTE 

Documentation minimale consultee (systems de classification suivi des symboles de classement) *~ 

CIB 6 C12Q 



Documentation consultee autre que la documentation minimale dans ia mesure ou ces documents relevent des domaines sur lesquels a porte la recherche 
Base de donnees electronique consultee au cours de la recherche Internationale (nom de la base de donnees, et si realisable, termes de recherche utilises) 



C. DOCUMENTS CONSIOERES COMME PERTINENTS 



Categoric J 


Identification des documents cites, avec, le cas echeant. Vindication des passages pertinents 


no. des revendications visees 


X 


COOPER D L ET AL: "GENE THERAPY ADVANCES: 


1,5-8, 
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14,15, 




12 octobre 1995 


26,27 


Y 
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29 aout 1996 
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WO 98 02576 A (UNIV MASSACHUSETTS) 
22 janvier 1998 



voir abrege; revendications 1,4,7,10,11,14 



FR 2 664 287 A (INST NAT SANTE RECH MED) 
10 janvier 1992 



voir abrege; revendications 1-15 

EP 0 330 781 A (TOA NENRYO K0GY0 KK) 
6 septembre 1989 
voir abrege 

voir page 11, ligne 23 - ligne 25 

EP 0 709 397 A (HEALTH RESEARCH INC) 
1 mai 1996 

voir abrege; revendications 1-10 

ALPHEY L: "PCR-based method isolation of 
full-length clones and splice variants 
from cDNA libraries" 
BIOTECHNIQUES , 

vol. 22, 1997, pages 481-486, XP002087172 
voir le document -en- -en t-ier - 

ARDLEY H C ET AL. : "Rapid isolation of 
genomic clones for individual members of 
human multigene families: Identification 
and localisation of UBE2L4, a novel member 
of a ubiquitin conjugating enzyme 
dispersed gene family" 
CYTOGENETICS AND CELL GENETICS, 
vol. 79, 1997, pages 188-192, XP002087173 
voir abrege 

voir page 188, colonne 1, alinea 1 - page 
190, colonne 1, alinea 1; figure 1 

-/-- 



I, 5-7, 
10, 

13-15, 
26-28, 
44-46 

II, 12,39 



1,5-7, 
10, 

13-15, 
26-28,44 
2-4,11, 
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16-22, 
45,46 

1,5,6, 
10, 

13-15, 

44,47 

2-4,8 

55 



47 
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16-28, 
33-35, 
38-43 
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BONASS W A ET AL. : "The rat amelogenin 
gene - some aspects of evolution and 
expression" 

ADVANCES IN DENTAL RESEARCH, 

vol. 10, no. 2, 1996, pages 182-186, 

XP0O2087174 

voir le document en entier 


16-28, 
33-35, 
38-43 


Y 


WO 94 12631 A (ISIS INNOVATION ;TARIN 
DAVID (GB); MATSUMURA YASUHIRO (GB)) 
9 juin 1994 

voir le document en entier 


1,5-8, 
13-15, 
26-28, 
44-47 


Y 


WO 97 46679 A (ST JUDE CHILDRENS RES 
HOSPITAL) 11 decembre 1997 

voir abrege; revendi cations 1-32 


1,5-8, 
10-15, 
26-32, 
39,44,47 


Y 


EP 0 806 478 A (HEALTH RESEARCH INC) 
12 novembre 1997 

voir le document en entier 


1,7,30, 

42,43, 

45,46 


Y 


WO 96 30512 A (RHONE POULENC RORER SA 
;BRACC0 LAURENT (FR); SCHWEIGHOFFER 
FABIEN) 3 octobre 1996 

voir le document en entier 


1,11-16, 
20,23, 

26-32, i 
38-41,44 


Y 


US 5 679 541 A (LEISERS0N WILLIAM M ET 
AL) 21 octobre 1997 

voir abrege 

voir colonne 21, ligne 9 - ligne 36 


1,5,6,9, 
16. 

20-22,31 


Y 


W0__9_7 04092 A .( RHONE POULENC RORER SA .. .. 

;C0NSEILLER EMMANUEL (FR); BRACC0 LAURENT 

( ) 6 fevrier 1997 

voir abrege; revendi cations 1-53 


.- 1,5-10, ■ ■- - 
30,42, 
43,45,46 


Y 


MILLER R D AND RIBLET R: "Improved phenol 

emulsion DNA reassociation technique 

(PERT) using thermal cycling" 

NUCLEIC ACIDS RESEARCH, 

vol. 23, no. 12, 1995, pages 2339-2340, 

XP002087175 

cite dans la demande 

voir le document en entier 


1,10 


A 


EP 0 791 660 A (SMITHKLINE BEECHAM CORP 
;UNIV WASHINGTON (US); UNIV SOUTH FLORIDA) 
27 aout 1997 

voir le document en entier 
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DIATCHENKO L ET AL: "SUPPRESSION 
SUBTRACT I VE HYBRIDIZATION: A METHOD FOR 
GENERATING DIFFERENTIALLY REGULATED OR 
TISSUE-SPECIFIC CDNA PROBES AND LIBRARIES" 
PROCEEDINGS OF THE NATIONAL ACADEMY OF 
SCIENCES OF USA, 

vol. 93, 1 juin 1996, pages 6025-6030, 

XP00 2911922 

cite dans la demande 

voir le document en entier 

PERRET E ET AL: "Improved differential 
screening approach to analyse 
transcriptional variations in organized 
cDNA libraries" 

GENE: AN INTERNATIONAL JOURNAL ON GENES 
AND GENOMES, 

vol. 208, no. 2, 22 fevrier 1998, page 

103-115 XP004114934 

voir le document en entier 

PELICCI G ET AL: "A NOVEL TRANSFORMING 
PROTEIN (SHC) WITH AN SH2 DOMAIN IS 
IMPLICATEDIN MITOGENIC SIGNAL 
TRANSDUCTION" 
CELL, 

vol. 70, no. 1, 10 juillet 1992, pages 
93-104, XP002001630 
cite dans la demande 
voir abrege; figure 1 

HARUN R B ET AL.: "Characterization of 
human SHC p66 cDNA and its processed 
pseudogene mapping to Xql2-ql3.1" 
GENOMICS, 

vol. 42, 1997, pages 349-352, XP002107843 
voir le document en entier 
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RAPPORT OE RECHERCHE INTERNATIONALE 



u/emande internationaie n° 



PCT/FR 99/00547 



Cadre I Observations - lorsqu'il a ete estime que certafnes revendications ne pouvaient pas faire I'objet d'une recherchi > 
(suite du point 1 de la premiere feuille) 



Conformement a I'artide 17.2)a), certaines revendications n'ont pas fait I'objet d'une recherche pour les motifs suivants: 

1 . | | Les revendications n°* 

se rapportent a un objet a regard duquel I'administration n'est pas tenue de proceder a la recherche, a savoir: 



□ 



Les revendications n 05 

se rapportent a des parties de la demande internationaie qui ne remplissent pas suffisamment les conditions prescrites pour 
qu'une recherche significative puisse etre effectuee, en particulier: 



□ 



Les revendications n 05 

sont des revendications dependantes et ne sont pas redigees conformement aux dispositions de la deuxieme et de la 
troisieme phrases de la regie 6.4. a). 



Cadre II Observations - lorsqu'il y a absence d'unite de Hnventlon (suite du point 2 de la premiere feuille) 



L'ad ministration chargee de la recherche internationaie a trouve piusieurs inventions dans la demande internationaie. a savoir: 

voir feuille supplemental* re 



1 • I I Comme toutes les taxes additionnelles ont ete payees dans les delais par le deposant. le present rapport de recherche 
1 internationaie porte sur toutes les revendications pouvant faire I'objet d'une recherche. 



Comme toutes les recherches portant sur les revendications qui s'y pretaient ont pu etre erfectuees sans effort particulier 
justifiant une taxe additionnelle. l administration n'a soilicite le paiement d'aucune taxe de cette nature. 



3. | Comme une partie seuiement des taxes additionnelles demandees a ete payee dans les delais par le deposant. le present 

1 1 rapport de recherche Internationale ne porte que sur les revendications pour lesquelles les taxes ont ete payees, a savoir 

les revendications n os 



4 - Aucune taxe additionnelle demandee n'a ete payee dans les delais par le deposant. En consequence, le present rapport 

de recherche internationaie ne porte que sur t'invention mentionnee en premier lieu dans les revendications; elle est 

couverte par les revendications n 03 



Remarque quant a la reserve 



| ^ Les taxes additionnelles etaient accompagnees d'une reserve de la part du deposari t. 
| j Le paiement des taxes additionnelles n'etait assorti d'aucune reserve. 
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Demande internationale No. PCTY FR 99/00547 



SUITE DES RENSEIGNEMENTS INDIQUES SUR PCT/ISA/ 210 

L' administration chargee de la recherche internationale a trouve plusieurs 
(groupes d' ) inventions dans la demande internationale, a savoir: 

1. Revendi cations: 1-47, 52-57 (complet) 

Des procedes d' identi f icati on et/ou de clonage de regions d'acides 
nuclei ques representatives de differences qualitatives entre deux 
echanti lions (patho)biol ogiques , des oligonucleotides bons pour le 
clonage de ces acides nucleiques, des acides nucleiques identifies 
par ces procedes, des compositions et des banques comprenant ces 
acides nucleiques, des kits comprenant ces banques, T utilisation 
de ces acides nucleiques, compositions ou banques, un procede d' 
identification et/ou de production de proteines reliees a une 
condition pathologique, une proteine identifiee ou produite par ce 
procede, un anticorps dirige contre cette proteine, un procede d' 
identification et/ou de clonage de genes suppresseurs de tumeurs, 
un procede de determination de la toxicite d'un compose, un procede 
de determination de 1'efficacite therapeutique d'un compose, et un 
procede de determination de la reponse d'un patient a un compose. 

2. Revendications: 48-51 (complet) 

Une proteine de sequences SEQ ID N0:9, une sonde nucleique ou 
anticorps permettant d' identifier cette proteine, un procede de 
criblage, et un vecteur comprenant une sequence codant pour cette 
proteine. 
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WO 9527052 
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12-10-1995 


AU 


2237395 


A 


23-10-1995 








CA 


2186854 


A 


12-10-1995 








EP 


0775202 


A 


28-05-1997 








JP 


9511400 


T 


18-11-1997 








ZA 


9502639 


A 


02-01-1996 


WO 9626272 


A 


29-08-1996 


AU 


5172596 


A 


11-09-1996 








CA 




A 


29-08-1996 








FP 




A 


17-12-1997 


WO 9802576 


A 


22-01-1998 


AU 


3494297 


A 


09-02-1998 


FR 2664287 


A 


10-01-1992 










EP 0330781 


A 


06-09-1989 


JP 




A 


31-08-1989 








CA 


1313151 


A 


26-01-1993 








DE 


3855076 


D 


11-04-1996 








hf 

l/C 


■jOjju / Q 


T 


17-10-1996 


EP 0709397 


A 


01-05-1996 


IK 


D\)OOy 1 0 


A 


18-11-1997 








PA 




A 


15-12-1995 








JP 
ur 


OUOIjUU 


A 


26-03-1996 








IK 




A 


10-03-1998 


WO 9412631 


A 


09-06-1994 


AT 




T 


15-05-1996 








fA 


c. 1 Jj4 1 U 


A 


03-02-1994 








PA 




A 


09-06-1994 








DF 

L/C 


UjJUll / O 


D 


23-05-1996 








DF 

L/C 




T 


19-09-1996 








EP 


0651822 


A 


10-05-1995 








EP 


0672130 


A 


20-09-1995 








WO 


9402633 


A 


03-02-1994 








JP 


2800850 


B 


21-09-1998 








■IP 


OjUU/ J 1 


T 


30-01-1996 








jp 


8506801 


T 


23-07-1996 








us 


5830646 


A 


03-11-1998 








IK 
uo 


DO / yoyo 


A 


09-03-1999 


W0 974667-9 - 


A 


- 1-1-12-1997 - 


- - All - 


JJUUjj / 


A- -- 


05-01-1998 - 


EP 0806478 


A 


12-11-1997 


IK 

KJ O 


C7J7f;cn 


A 


05-05-1998 








IK 


D / LOUt4 


A 


10-03-1998 


W0 9630512 


A 


03-10-1996 


FR 

r rv 
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04-10-1996 








Ali 
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16-10-1996 








DO 
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EP 
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JP 
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